Ми змогли відтворити переконливі висновки документа з управління персоналом щодо ARC-AGI-1. Крім того, ми провели серію експериментів з абляцією, щоб докопатися до суті того, що за цим стоїть. Ключові висновки: 1. Сама архітектура моделі HRM (центральний елемент статті) не є важливим фактором. 2. Зовнішня петля уточнення (майже не згадана в статті) є основним драйвером продуктивності. 3. Навчання перехресного перенесення не дуже корисне. Важливим є навчання на завданнях, на яких ви будете тестуватися. 4. Ви можете використовувати набагато менше доповнень даних, особливо під час висновків. Знаходження 2 і 3 означають, що цей підхід є випадком *тренування без попереднього тренування під час тестування*, подібно до нещодавно опублікованої статті «ARC-AGI без попередньої підготовки» Ляо та ін.
241,69K