Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Rozwiązanie termiczne z diamentowych chipów (Diamond Thermal Solution) ma na celu odpowiedzenie na rosnące napięcie związane z TDP GPU NVIDIA AI:
1. Zalety diamentowych materiałów w zakresie oporu cieplnego
Tradycyjna ścieżka cieplna „miedziana pokrywa + TIM + płyta chłodząca” staje się dość napięta przy około 700W, a opór cieplny głównie tkwi w interfejsie między chipem a płytą chłodzącą, który ma zaledwie kilkaset mikrometrów. Przewodność cieplna miedzi wynosi około 400 W/m·K, podczas gdy wysokiej jakości diament CVD może osiągnąć 1000–1500 W/m·K, a diament monokrystaliczny nawet zbliża się do 2000 W/m·K, co oznacza, że jest co najmniej 3–5 razy lepszy od miedzi. Wprowadzenie diamentu na poziom chipów (zastępując obecne materiały TIM) przy tej samej grubości i powierzchni może obniżyć opór cieplny w kierunku pionowym o ponad 50%, co w praktyce może obniżyć temperaturę styku o 10–20°C dla GPU o mocy 1–2kW lub pozwolić na zwiększenie mocy o kilka set watów przy zachowaniu pierwotnego limitu temperatury. To pozwala na rozwój B200/B300 do 1.2–1.4kW oraz Rubin/Ultra do 2.3–3.5kW, przy zachowaniu tej samej infrastruktury chłodzenia cieczą lub zanurzeniowego, co umożliwia wsparcie dla kilku kolejnych generacji, a także pozostawia więcej miejsca na projektowanie cieplne dla większej liczby GPU w pojedynczej jednostce i szafie.
2. Znaczące zwiększenie niezawodności pakowania
Gdy moc wzrasta do 2000W, a nawet 3000W, gradienty temperatury i stres cieplny, którym poddawane są pakowanie, płyty nośne i płyty główne, mogą wzrosnąć wielokrotnie, co może prowadzić do odkształceń pakowania i powstawania pęcherzyków TIM, a w najgorszym przypadku do zmęczenia punktów lutowniczych, pęknięć RDL/wysp, co wpływa na długoterminową niezawodność. Diamentowy rozpraszacz ciepła nie tylko dobrze przewodzi ciepło w kierunku pionowym, ale także ma bardzo wysoką przewodność cieplną w obrębie płaszczyzny, co pozwala na szybkie rozpraszanie hotspotów w odległości kilku milimetrów, rozpraszając pierwotnie skoncentrowane w lokalnych obszarach szczyty cieplne o wartości 300–500W, co znacznie zmniejsza różnice temperatur w różnych obszarach chipu. To oznacza, że „odpręża” pakowanie i płytę: niedopasowanie rozszerzalności cieplnej między krzemem, materiałami pakującymi a płytą nośną jest łagodzone, a odkształcenia pakowania i cykle zmęczenia punktów lutowniczych są wydłużane. Dla GPU o wysokiej mocy, takich jak Rubin / Rubin Ultra / Feynman, długotrwałe szkolenie LLM i usługi inferencyjne mogą działać bliżej nominalnej częstotliwości w stabilny sposób, co zmniejsza marnotrawstwo mocy obliczeniowej spowodowane przegrzewaniem i obniżaniem częstotliwości lub nieprawidłowymi ponownymi uruchomieniami, a także zwiększa ogólny MTBF i żywotność.
3. Koszty serwerowni i elastyczność rozbudowy
Gdy TDP pojedynczego GPU wzrasta, całkowita moc szafy szybko zbliża się lub przekracza 120kW, 130kW, co wymaga dużych zmian w infrastrukturze zasilania i chłodzenia serwerowni. Jeśli zdolność przewodzenia ciepła na poziomie chipu nie zostanie zwiększona, można jedynie nieustannie dodawać droższe CDU, wieże chłodnicze i struktury zasilania, a także często zmuszeni jesteśmy do obniżania temperatury wody chłodzącej i maksymalizacji przepływu. Wprowadzenie diamentowego chłodzenia chipów sprawia, że pojedynczy GPU ma niższą temperaturę przy tej samej temperaturze wody i przepływie, co zmniejsza prawdopodobieństwo obniżania częstotliwości, a rzeczywista „stabilna moc obliczeniowa na szafę” wzrasta; jednocześnie, dzięki obniżeniu oporu cieplnego, istnieje możliwość pozwolenia na nieco wyższą temperaturę wody lub niższy przepływ, co zmniejsza zużycie energii przez pompy i chłodnice. Co ważniejsze, otwiera to elastyczność projektowania cieplnego dla przyszłych GPU o mocy 3.5kW–5kW, takich jak Rubin Ultra, Feynman, co pozwala producentom systemów i dostawcom chmur na traktowanie chłodzenia diamentowego jako „opcji ulepszenia na poziomie materiału” podczas planowania następnej generacji klastrów AI, przekształcając chłodzenie z działania naprawczego w integralną część wczesnego projektowania architektury, a nie czekając na kryzys cieplny, aby znaleźć rozwiązanie.

Najlepsze
Ranking
Ulubione
