Nvidia GB200 NVL72 поки не готова для навчання передових моделей ШІ

watch 8s
views 2

15:30, 26.08.2025

Зміст статті
arrow

  • Чому навчання поки що неможливе
  • Рекомендації аналітиків і фокус Nvidia
  • Прогноз на майбутнє та економічна сторона

Аналітичне агентство SemiAnalysis опублікувало аналіз серверних рішень для навчання штучного інтелекту і дійшло висновку, що для навчання передових моделей на даний момент краще підходять прискорювачі Nvidia H100 і H200, а також TPU від Google. Серверні стійки GB200 NVL72 з новітніми GPU Nvidia стикаються з проблемами через мідну комутаційну плату NVLink і недосконалі засоби діагностики та налагодження, що призводить до простоїв.

Чому навчання поки що неможливе

Теоретично «відвал» одного чіпа не є критичним — в NVL72 рекомендується навчати ШІ на 64 GPU GB200, а ще 8 залишати в резерві. Однак для їх підключення необхідно швидко локалізувати несправність, що поки що є складним через обмежені діагностичні інструменти. В результаті зупиняється процес навчання, відкочуються чекпоінти і затягується ремонт. SemiAnalysis відзначає, що поки не відомий жоден завершений приклад тренування передової моделі на GB200 NVL72.

Рекомендації аналітиків і фокус Nvidia

На даний момент аналітики радять використовувати GB200 NVL72 переважно для інференсу — запуску вже навчених моделей. Nvidia в останніх матеріалах також робить акцент на інференсі, хоча в ранніх анонсах передбачалася паралельна робота над тренуванням і запуском моделей.

Прогноз на майбутнє та економічна сторона

SemiAnalysis прогнозує, що Nvidia зможе усунути проблеми з NVLink і програмним забезпеченням до кінця року. При цьому вартість володіння одним GPU GB200 в 1,6–1,7 рази вища, ніж у H100. Щоб виправдати інвестиції в нові прискорювачі, вони повинні демонструвати мінімум в 1,6 рази більшу продуктивність при аналогічному часі простою.

Поділитися

Чи була ця стаття корисною для вас?

Популярні пропозиції VPS

-15.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
60 Mbps
DDoS Protected SSD-wKVM 4096 Windows

73

При оплаті за рік

-10%

CPU
CPU
2 Epyc Cores
RAM
RAM
1 GB
Space
Space
10 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 1024 Linux

7.1

При оплаті за рік

-20.8%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
10 TB
wKVM-SSD 16384 Metered Windows

100

При оплаті за рік

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-KVM-SSD 8192 Linux

115.5

При оплаті за рік

-4.8%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
40 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 1024 Windows

10.21

При оплаті за рік

-10%

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 32768 Linux

70.49

При оплаті за рік

-20.5%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
10 TB
KVM-SSD 16384 Metered Linux

95

При оплаті за рік

-5%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
40 GB HDD
Bandwidth
Bandwidth
Unlimited
wKVM-HDD 1024 Windows

12.1

При оплаті за рік

-15.6%

CPU
CPU
2 Xeon Cores
RAM
RAM
512 MB
Space
Space
10 GB SSD
Bandwidth
Bandwidth
1 TB
KVM-SSD 512 Metered Linux

5.33

При оплаті за рік

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
200 GB HDD
Bandwidth
Bandwidth
Unlimited
KVM-HDD 8192 Linux

25.25

При оплаті за рік

Інші статті на цю тему

cookie

Чи приймаєте ви файли cookie та політику конфіденційності?

Ми використовуємо файли cookie, щоб забезпечити вам найкращий досвід роботи на нашому сайті. Якщо ви продовжуєте користуватися сайтом, не змінюючи налаштувань, вважайте, що ви згодні на отримання всіх файлів cookie на сайті HostZealot.