Esto es correcto en la dirección. El equilibrio entre HBM y SRAM en el diseño arquitectónico era evidente hace muchos años. Los que eligieron HBM están en una cola detrás de Nvidia y Google. Suerte con eso. De forma más general, los patrones de decodificación de LLM favorecen la SRAM. Pero a diferencia de Gavin, creo que esto crea una vía para que silicio aún más heterogéneo soporte modelos de IA en el futuro. No menos. Sospecho que los dos ejes que importan son precisión frente a velocidad y si puedes diseñar una solución enfocada para un caso de uso específico de IA, habrá mercado.