Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
La soluzione termica in diamante (Diamond Thermal Solution) ha come obiettivo principale quello di affrontare la pressione termica sui sistemi e nei data center causata dall'improvviso aumento del TDP delle GPU NVIDIA AI:
1. Vantaggi della bassa resistenza termica dei materiali in diamante
Il percorso termico tradizionale "coperchio in rame + TIM + piastra di raffreddamento" diventa piuttosto critico intorno ai 700W, con la resistenza termica che si concentra principalmente nell'interfaccia di pochi centinaia di micron tra il chip e la piastra di raffreddamento. La conduttività termica del rame è di circa 400 W/m·K, mentre il diamante CVD policristallino di alta qualità può raggiungere 1000–1500 W/m·K, e il diamante monocrystallino si avvicina persino a 2000 W/m·K, il che equivale ad essere almeno 3–5 volte superiore a quella del rame. Introducendo il diamante a livello del chip (sostituendo i materiali TIM attuali), si prevede che la resistenza termica verticale possa diminuire di oltre il 50% mantenendo lo stesso spessore e area, permettendo di ridurre la temperatura di giunzione di 10–20°C per GPU di livello 1–2kW, o di gestire qualche centinaio di watt in più mantenendo il limite di temperatura originale. Questo consente ai modelli B200/B300 di spingersi verso 1.2–1.4kW e Rubin/Ultra verso 2.3–3.5kW, permettendo alla stessa attrezzatura di raffreddamento a liquido o a immersione di sostenere diverse generazioni, e di lasciare più spazio per il design termico per ulteriori GPU in un singolo sistema e armadio.
2. Aumento significativo della durata e dell'affidabilità del packaging
Quando il consumo energetico raggiunge 2.000W o addirittura oltre 3.000W, il gradiente di temperatura e lo stress termico a cui sono sottoposti il packaging, il substrato e la scheda madre aumentano esponenzialmente, causando potenzialmente deformazioni del packaging e cavità nel TIM, fino a portare a fatica nei punti di saldatura, rottura del RDL o dei bump, compromettendo l'affidabilità a lungo termine. Il dissipatore di calore in diamante non solo ha una buona conduttività termica verticale, ma anche un'ottima conduttività termica in piano, permettendo di distribuire rapidamente i picchi di calore di 300–500W su pochi millimetri, riducendo notevolmente le differenze di temperatura tra le diverse aree del chip. Questo equivale a "alleviare" la pressione sul packaging e sul substrato: l'incompatibilità dell'espansione termica tra silicio, materiali di packaging e substrato viene attenuata, prolungando i cicli di deformazione del packaging e di fatica nei punti di saldatura. Per GPU ad alta potenza come Rubin / Rubin Ultra / Feynman, i servizi di addestramento e inferenza LLM a lungo termine possono operare più vicino alla frequenza nominale in modo stabile, riducendo gli sprechi di potenza computazionale causati da surriscaldamento e abbassamento della frequenza o da riavvii anomali, aumentando anche l'MTBF complessivo e la durata.
3. Costi del data center e flessibilità di espansione
Quando il TDP di una singola GPU aumenta, la potenza totale del rack si avvicina rapidamente o supera i 120kW, 130kW, richiedendo una revisione significativa delle infrastrutture di distribuzione elettrica e raffreddamento del data center. Se la capacità di conduzione termica del chip non viene migliorata, si è costretti a sovraccaricare costosi CDU, torri di raffreddamento e strutture di distribuzione, e per mantenere la temperatura si è spesso costretti a ridurre drasticamente la temperatura dell'acqua di raffreddamento e a spingere il flusso al limite. Con l'introduzione della soluzione termica in diamante, una singola GPU avrà una temperatura più bassa e una minore probabilità di abbassamento della frequenza a parità di temperatura e flusso dell'acqua, aumentando effettivamente la "potenza computazionale stabile per rack" disponibile per ogni armadio; allo stesso tempo, grazie alla riduzione della resistenza termica, si avrà anche la possibilità di consentire temperature dell'acqua leggermente più elevate o flussi più bassi, riducendo il consumo energetico delle pompe e dei chiller. Ancora più importante, apre la flessibilità di design termico per le future GPU di livello 3.5kW–5kW come Rubin Ultra e Feynman, consentendo ai produttori di sistemi e ai fornitori di cloud di considerare il raffreddamento in diamante come un "opzione di aggiornamento a livello di materiale" nella pianificazione dei cluster AI di prossima generazione, trasformando il raffreddamento da una soluzione reattiva a una parte integrante della progettazione architettonica iniziale, invece di aspettare che si verifichino problemi termici per trovare una soluzione.

Principali
Ranking
Preferiti
