Nvidia готує GPU нового покоління для роботи з мільйонним контекстом

watch 6s
views 2

16:03, 10.09.2025

Зміст статті
arrow

  • Архітектура Disaggregated Inference
  • Прорив для бізнесу і науки
  • Фокус на інференс, а не навчання
  • Вихід на ринок

Nvidia представила графічний процесор Rubin CPX, спроектований спеціально для мовних і мультимодальних моделей, яким необхідно утримувати і аналізувати величезні обсяги даних. Чіп оптимізований під обробку контекстів понад 1 мільйон токенів — показник, який значно перевищує можливості сучасних систем.

Архітектура Disaggregated Inference

Ключова інновація Rubin CPX — використання архітектури disaggregated inference. При такому підході кілька GPU обробляють різні частини завдання, а потім об'єднують результати в єдину відповідь. Це підвищує швидкість роботи, знижує затримки і робить використання ресурсів більш ефективним. Особливо корисно це для аналізу документів, генерації мультимедійного контенту і роботи з великими кодовими проектами.

Прорив для бізнесу і науки

Nvidia відзначає, що Rubin CPX відкриває нові горизонти для юристів, медиків і розробників. У праві він допоможе працювати з сотнями сторінок законів, в медицині,  зіставляти великі масиви даних пацієнтів, а в IT,  аналізувати цілі проекти замість окремих файлів. У творчій сфері GPU дозволить генерувати довгі відеоролики та комплексні мультимедійні проекти.

Фокус на інференс, а не навчання

На відміну від традиційних рішень, Rubin CPX націлений насамперед на оптимізацію інференсу — прискорення роботи вже готових моделей. Це робить його привабливим для компаній, яким важливо швидше впроваджувати ШІ в реальний бізнес при зниженні витрат.

Вихід на ринок

Поява Rubin CPX очікується в кінці 2026 року. Експерти припускають, що саме цей процесор може задати новий стандарт для індустрії, де робота з довгим контекстом перестане бути рідкістю і стане нормою.

Поділитися

Чи була ця стаття корисною для вас?

Популярні пропозиції VPS

-8.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-wKVM-SSD 2048 Windows

37.4

При оплаті за рік

-20.4%

CPU
CPU
2 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 2048 HK Linux

18

При оплаті за рік

-7.9%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
200 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 8192 Windows

25.74

При оплаті за рік

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 16384 Linux

49.99

При оплаті за рік

-12.8%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
1 TB
wKVM-SSD 1024 Metered Windows

17

При оплаті за рік

-29.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
2 TB
KVM-SSD 2048 Metered Linux

17

При оплаті за рік

-10%

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
Keitaro KVM 32768
OS
CentOS
Software
Software
Keitaro

77.54

При оплаті за рік

-10%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 32768 Linux

69.99

При оплаті за рік

-8.1%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
200 GB HDD
Bandwidth
Bandwidth
Unlimited
wKVM-HDD 8192 Windows

31.25

При оплаті за рік

-26.7%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
20 GB SSD
Bandwidth
Bandwidth
1 TB
KVM-SSD 1024 Metered Linux

10

При оплаті за рік

Інші статті на цю тему

cookie

Чи приймаєте ви файли cookie та політику конфіденційності?

Ми використовуємо файли cookie, щоб забезпечити вам найкращий досвід роботи на нашому сайті. Якщо ви продовжуєте користуватися сайтом, не змінюючи налаштувань, вважайте, що ви згодні на отримання всіх файлів cookie на сайті HostZealot.