关于NVIDIA Rubin和AMD MI455X的看法 让我们深入比较一下今天发布的Nvidia的Rubin和AMD的MI455X。 首先谈谈Rubin,它采用了8堆栈的HBM4配置。它的内存带宽高达22TB/s,利用每个引脚的Fmax约为10.7Gbps。 另一方面,MI455X选择了12堆栈的HBM4设置。然而,它的带宽为19.6TB/s,使用的内存每个引脚的Fmax大约为6.4Gbps。 考虑到当前JEDEC标准的HBM4为8Gbps,差异显而易见:Rubin使用的是顶级、高规格的HBM4,而MI455X似乎依赖于低于标准规格的HBM4。 这突显了企业战略的明显分歧:使用顶级组件与强行提升容量。 AMD可能采用这种方法是因为确保顶速HBM4的供应对他们来说具有挑战性。然而,这种策略带来了两个重大风险。 首先是成本和良率的影响。增加更多的HBM堆栈需要更大的中介层面积,这直接推高了单元成本。此外,更大的占地面积不可避免地降低了2.5D封装组装的良率。换句话说,使用更多低规格HBM4单元的策略可能会比Nvidia使用更少高规格HBM4单元的策略更昂贵。 其次是在内存短缺期间的影响。这种方法加剧了供应链瓶颈。与8堆栈设计相比,12堆栈配置每个GPU消耗的HBM芯片/堆栈多出50%。全球HBM4供应越紧张,AMD的出货量就越受内存可用性的限制。 当然,在高规格HBM4的良率较低的早期阶段,这并不是一个主要问题——顶级部件的低良率自然会导致低等级供应的过剩。 但是,随着良率学习曲线的改善,会发生什么呢?随着高规格HBM4的良率上升,供应商将更有动力将晶圆分配给目标为Nvidia的高利润芯片。这使得AMD越来越难以以低价采购大量低性能的HBM4。此外,随着三星在HBM4领域表现良好,AMD将无法像在HBM3E周期那样以“清仓”价格获取库存。 最终,AMD在芯片层面面临着比Nvidia的Rubin更不利的成本结构。