热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
我们能够重现HRM论文中关于ARC-AGI-1的强有力发现。
此外,我们进行了系列消融实验,以深入了解其背后的原因。
关键发现:
1. HRM模型架构本身(论文的核心部分)并不是一个重要因素。
2. 外部精炼循环(在论文中几乎没有提及)是性能的主要驱动因素。
3. 跨任务迁移学习并不是很有帮助。重要的是在你将要测试的任务上进行训练。
4. 你可以使用更少的数据增强,特别是在推理时。
发现2和3意味着这种方法是一种*零预训练测试时训练*的案例,类似于Liao等人最近发表的"没有预训练的ARC-AGI"论文。
196.84K
热门
排行
收藏