2026 рік консолідується у три дуже великі ставки, де у разі провалу одна з них призведе до короткочасного краху бульбашки 1. дата-центри антропний, Сай агресивно масштабується до 1M GPU. обидві планують досягти цієї мети до другого кварталу. Отримані моделі, навчені на цій інфраструктурі, повинні підтверджувати, що закон масштабування обчислень все ще ефективний. інакше це означає, що нам потрібно досліджувати нову архітектуру моделі. Це також залежить від масштабування енергетичної інфраструктури (Power Shell), хоча це буде проблемою протягом наступного десятиліття, не кажучи вже про цей рік. 2. пам'ять Цього року у нас достатньо пам'яті лише для підтримки GPU на 15 ГВт, тоді як гіперскейлери націлені на 30-40 протягом наступних 2 років. Ми досить близькі — якщо Samsung, $MU або SK Hynix скоротять виробництво, це загальмує першу ставку. Крім того, той, хто отримає більшу частину цієї пам'яті для створення GPU, найбільше виграє в межах обмежених виробничих потужностей, і наразі це $NVDA 3. Дешевша, ефективніша інфраструктура Остання відеокарта Nvidia Vera Rubin у 5 разів продуктивніша, але, що важливо, у 4 рази ефективніша за обчисленнями, тобто витрати на виведення різко знизилися — Frontier Intelligence за копійки! Цього року буде багато обчислювальних ресурсів для навчання, але ще важливіше — використовувати ШІ, тому Парадокс Джевона має довести свою спроможність через зростаючий попит. якщо це не вдається, то вищезазначені два згортаються. На мою думку, це мене найменше турбує — думаю, агентські ремень і післятренінговий RL продовжать посилювати моделі. Дуже оптимістично