Questo sembra grande Una nuova startup europea chiamata Euclyd è appena uscita dall'ombra e vuole rivoluzionare l'hardware per l'inferenza AI. Stanno costruendo un enorme sistema di chip chiamato Craftwerk, un SiP con molti chiplet con 16.384 processori, in grado di fornire fino a 32 PFLOPS, abbinato a un sistema di memoria personalizzato chiamato UBM che offre 1 TB di DRAM e 8000 TB/s di larghezza di banda. L'obiettivo - un consumo energetico e un costo per token molto inferiori rispetto alle soluzioni attuali, rendendo l'inferenza AI potente disponibile in tutto il mondo, non solo ai hyperscalers da trilioni di dollari. La scala di Craftwerk - un'unità singola potrebbe generare 20.000 token/sec (rispetto ai ~1.000 di Nvidia), e un'intera rack potrebbe raggiungere 7,68 milioni di token/sec per modelli grandi come Llama-4.