炒作 / 现实
Liron Shapira
Liron Shapira2025年10月30日
今天的Extropic发布引发了一些新的警示信号。 当这家公司拒绝解释他们正在构建的输入/输出规范时,我开始关注他们,让我们等待澄清。 以下是今天的三个警示信号: 1. 来自 "生成性AI是采样。所有生成性AI算法本质上都是从概率分布中采样的过程。训练生成性AI模型对应于推断一些训练数据所依据的概率分布,而运行推断对应于从学习到的分布中生成样本。因为TSUs进行采样,所以它们可以原生运行生成性AI算法。" 这是一个关于驱动现代最有用AI的算法的高度误导性声明,和称人脑为热力学计算机的气灯效应同样严重。根据我所理解的,迄今为止,AI计算工作的大多数并不符合可以输入到Extropic芯片中的那种输入/输出。 页面上写道: "下一个挑战是弄清楚如何以某种方式组合这些原语,以便将能力扩展到与今天的LLMs相当的水平。为此,我们需要构建非常大的TSUs,并发明可以消耗任意数量概率计算资源的新算法。" 你真的需要构建大型TSUs来研究LLM类应用是否能从这项硬件中受益吗?我本以为花几百万美元通过理论和现代云超级计算硬件来调查这个问题是值得的,而不是花费超过3000万美元来构建可能是无用的硬件。 他们自己关于THRML(他们的开源库)的文档中写道: "THRML提供了用于在稀疏异构图上进行块采样的GPU加速工具,使其成为今天原型和未来Extropic硬件实验的自然场所。" 你在说你缺乏一种方法,你的硬件原语在原则上可以应用于某种有用的应用,而你创建了这个库来帮助使用今天的GPU进行这种研究…… 为什么你不早点发布Python库(THRML),进行你所说的需要提前完成的瓶颈研究,并与社区合作,帮助你在现在得到这个关键问题的答案?为什么你一直在等待,首先推出这个极其小众的小规模硬件原型,来解释这个生死攸关的瓶颈,并且现在才公开寻找有某种相关“概率工作负载”的潜在合作伙伴,而不这样做的代价是3000万美元和18个月? 2. 来自 "我们开发了我们的TSU架构模型,并用它来估算运行上述动画中显示的去噪过程所需的能量。我们发现,运行在TSUs上的DTMs可以比标准图像生成算法在GPU上节省约10,000倍的能量。" 我已经看到Twitter上的人们在炒作这个10,000倍的说法。但对于任何跟随量子计算公司声称实现“量子霸权”的几十年长的故事的人来说,你知道在定义这种基准时需要多么小心。 实际上,通常很难指出经典计算方法在什么情况下*不是*比声称的“10,000倍更快的热力学计算”方法要快。Extropic团队知道这一点,但选择不详细说明能够重现他们想要看到的这种炒作基准的条件。 3. 他们使用的术语已被更改为“概率计算机”:"我们设计了世界上第一个可扩展的概率计算机。"直到今天,他们一直使用“热力学计算机”作为他们的术语,并在书面上声称“人脑是热力学计算机”。 人们可以给他们一些好处的怀疑,认为他们在术语上进行了转变。只是他们一直在谈论人脑是“热力学计算机”的胡说八道(在我看来,人脑既不是那种也不是“量子计算机”;它非常像在经典计算机架构上运行的神经网络算法)。而这种突然的术语转变与他们在这一方面一直在说胡话是一致的。 现在说说积极的方面: * 确实有一些硬件被构建出来! * 他们解释了其输入/输出在去噪方面可能有应用,尽管如前所述,他们对所声称的“10,000倍热力学优势”的细节模糊不清。 总体而言: 这正是我在18个月前第一次开始询问输入输出时所预期的。 他们有一个真正酷的硬件想法,但没有计划使其有用,但有一些模糊的理论研究开端,有机会使其有用。 他们似乎在将硬件投入生产方面取得了可观的进展(3000万美元能买到的量),而在寻找理由说明这种特定硬件,即使经过10代继任者的改进,为什么对任何人都有用方面似乎进展较少。 展望未来,而不是通过“压制”人们并说这是公司机密来回应关于你设备输入/输出的问题,并在推特上发布关于你热力学神的超自然信念,我建议你更开放地讨论技术社区可能真正感兴趣帮助你回答的看似巨大的生死攸关的问题:是否有人可以在你的模拟器中编写Python程序,以更强的证据表明某种有用的“热力学优势”与您的硬件概念可能永远是一个现实。
想象一下,一个人在酒吧里自夸他一定能在附近的路灯下找到他的钥匙。大家都转过头去看路灯。似乎没有任何钥匙。 这就是Extropic声称拥有AI应用的样子。还有,这个家伙说他的搜索每年花费2000万美元 🤦‍♂️
61