Det här verkar stort En ny europeisk startup som heter Euclyd har precis kommit ut ur smyg och vill skaka om hårdvaran för AI-inferens. De bygger ett massivt chipsystem som kallas Craftwerk, en SiP med många chiplet med 16 384 processorer, som levererar upp till 32 PFLOPS, och parat med ett anpassat minnessystem som kallas UBM som ger 1 TB DRAM och 8000 TB/s bandbredd. Målet är mycket lägre strömförbrukning och kostnad per token än dagens lösningar, vilket gör kraftfull AI-inferens tillgänglig över hela världen, inte bara för hyperscalers på biljoner dollar. Craftwerks skala - en enda enhet kan generera 20 000 tokens/sek (jämfört med Nvidias ~1 000), och ett fullt rack kan nå 7,68 miljoner tokens/sek för stora modeller som Llama-4.