Isto parece grande Uma nova startup europeia chamada Euclyd acaba de sair do modo stealth e quer revolucionar o hardware de inferência de IA. Eles estão a construir um sistema de chip massivo chamado Craftwerk, um SiP com muitos chiplets com 16.384 processadores, entregando até 32 PFLOPS, e emparelhado com um sistema de memória personalizado chamado UBM que fornece 1 TB de DRAM e 8000 TB/s de largura de banda. O objetivo - um consumo de energia e custo por token muito mais baixos do que as soluções atuais, tornando a inferência de IA poderosa disponível em todo o mundo, não apenas para hiperescaladores de trilhões de dólares. A escala do Craftwerk - uma única unidade poderia gerar 20.000 tokens/segundo (vs. ~1.000 da Nvidia), e um rack completo poderia atingir 7,68 milhões de tokens/segundo para modelos grandes como o Llama-4.