一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

关于NVIDIA Rubin和AMD MI455X的看法让我们深入比较一下今天发布的Nvidia的Rubin和AMD的MI455X。首先谈谈Rubin，它采用了8堆栈的HBM4配置。它的内存带宽高达22TB/s，利用每个引脚的Fmax约为10.7Gbps。另一方面，MI455X选择了12堆栈的HBM4设置。然而，它的带宽为19.6TB/s，使用的内存每个引脚的Fmax大约为6.4Gbps。考虑到当前JEDEC标准的HBM4为8Gbps，差异显而易见：Rubin使用的是顶级、高规格的HBM4，而MI455X似乎依赖于低于标准规格的HBM4。这突显了企业战略的明显分歧：使用顶级组件与强行提升容量。 AMD可能采用这种方法是因为确保顶速HBM4的供应对他们来说具有挑战性。然而，这种策略带来了两个重大风险。首先是成本和良率的影响。增加更多的HBM堆栈需要更大的中介层面积，这直接推高了单元成本。此外，更大的占地面积不可避免地降低了2.5D封装组装的良率。换句话说，使用更多低规格HBM4单元的策略可能会比Nvidia使用更少高规格HBM4单元的策略更昂贵。其次是在内存短缺期间的影响。这种方法加剧了供应链瓶颈。与8堆栈设计相比，12堆栈配置每个GPU消耗的HBM芯片/堆栈多出50%。全球HBM4供应越紧张，AMD的出货量就越受内存可用性的限制。当然，在高规格HBM4的良率较低的早期阶段，这并不是一个主要问题——顶级部件的低良率自然会导致低等级供应的过剩。但是，随着良率学习曲线的改善，会发生什么呢？随着高规格HBM4的良率上升，供应商将更有动力将晶圆分配给目标为Nvidia的高利润芯片。这使得AMD越来越难以以低价采购大量低性能的HBM4。此外，随着三星在HBM4领域表现良好，AMD将无法像在HBM3E周期那样以“清仓”价格获取库存。最终，AMD在芯片层面面临着比Nvidia的Rubin更不利的成本结构。