Реальний конкурент Nvidia і один чип замість тисяч серверів
12:39, 09.12.2025
Компанія Cerebras Systems розробила Wafer Scale Engine – найоб'ємніший процесор розміром з обідню тарілку. Ця інженерна інновація була створена з метою мінімізації часу на шляху між серверами. Нова система складається з моноліту, в якому одночасно поєднані обчислення і пам'ять.
Геополітичні обмеження
Наприкінці поточного року компанія Cerebras Systems замість очевидного успіху в секторі напівпровідників зіткнулася з реальними проблемами публічного розміщення. Уже в жовтні компанія закрила приватний раунд фінансування обсягом $1,1 млрд.
Cerebras показувала фантастичні результати, її прибуток досяг $500 млн, а серед клієнтів з'явилися Meta, AWS і IBM. Однак ситуація різко змінилася, оскільки комітет з іноземних інвестицій США заблокував її вихід на біржу через можливий витік технології до Китаю.
Більше 80 відсотків доходів компанії генерує холдинг G42 з Абу-Дабі. Дане партнерство розцінюється як стратегічна загроза через масштаб партнерства компаній і походження капіталу.
Таким чином, компанія з рішеннями, які явно перевершують Nvidia, опинилася заручницею політичної ситуації.
Особливості флагманського чипа Cerebras WSE-3
Cerebras WSE-3 – це пластина, яка функціонує як єдиний суперпроцесор. У той час, як архітектура Nvidia складається з величезних кластерів. Також, Nvidia Blackwell використовує стандарт пам'яті HBM, і вона розташована не всередині обчислювального кристала, а поруч. Такий підхід призводить до затримки при зверненні до даних.
Cerebras, у свою чергу, повністю змінила підхід, і вся пам'ять інтегрована в структуру чипа (SRAM). В результаті чого, компанія не тільки мінімізує латентність, але і не буде перебувати в стані дефіциту HBM пам'яті, так як Nvidia фактично монополізувала поставки HBM.
Надшвидка пам'ять SRAM інтегрована в обчислювальні ядра, що забезпечує пропускну здатність в 21 петабайт в секунду – це феноменальні показники, якщо порівнювати з топовими рішеннями Nvidia.
Масштабування для досягнення сучасних потужностей
Сучасні LLM функціонують на кластерах відеокарт для досягнення очікуваного результату. Для створення шини NVLink і забезпечення синхронної роботи тисячі чипів, Nvidia витратила багато часу і ресурсів. Але кластери все ж використовують більше енергії на пересилання результатів і синхронізацію.
У той час, як WSE-3 не має такої проблеми, завдяки можливості розміщення 900 000 ядер на одному шматку кремнію. У новому підході немає оптичних трансиверів, мережевих кабелів і комутаторів, тому внутрішні затримки зводяться до нуля.