INTELLECT-3 在某些基准测试中已经达到了 SOTA-ish 的水平 在 Misdirected Attention 上与前沿模型相当,并且超越了像 Opus 4.5 这样的模型——这是一个评估模型良好阅读能力的有趣基准,而不是基于氛围的完成 对我们今年即将推出的下一个模型感到非常兴奋 🫡