Nvidia готує GPU нового покоління для роботи з мільйонним контекстом

watch 6s
views 2

16:03, 10.09.2025

Зміст статті
arrow

  • Архітектура Disaggregated Inference
  • Прорив для бізнесу і науки
  • Фокус на інференс, а не навчання
  • Вихід на ринок

Nvidia представила графічний процесор Rubin CPX, спроектований спеціально для мовних і мультимодальних моделей, яким необхідно утримувати і аналізувати величезні обсяги даних. Чіп оптимізований під обробку контекстів понад 1 мільйон токенів — показник, який значно перевищує можливості сучасних систем.

Архітектура Disaggregated Inference

Ключова інновація Rubin CPX — використання архітектури disaggregated inference. При такому підході кілька GPU обробляють різні частини завдання, а потім об'єднують результати в єдину відповідь. Це підвищує швидкість роботи, знижує затримки і робить використання ресурсів більш ефективним. Особливо корисно це для аналізу документів, генерації мультимедійного контенту і роботи з великими кодовими проектами.

Прорив для бізнесу і науки

Nvidia відзначає, що Rubin CPX відкриває нові горизонти для юристів, медиків і розробників. У праві він допоможе працювати з сотнями сторінок законів, в медицині,  зіставляти великі масиви даних пацієнтів, а в IT,  аналізувати цілі проекти замість окремих файлів. У творчій сфері GPU дозволить генерувати довгі відеоролики та комплексні мультимедійні проекти.

Фокус на інференс, а не навчання

На відміну від традиційних рішень, Rubin CPX націлений насамперед на оптимізацію інференсу — прискорення роботи вже готових моделей. Це робить його привабливим для компаній, яким важливо швидше впроваджувати ШІ в реальний бізнес при зниженні витрат.

Вихід на ринок

Поява Rubin CPX очікується в кінці 2026 року. Експерти припускають, що саме цей процесор може задати новий стандарт для індустрії, де робота з довгим контекстом перестане бути рідкістю і стане нормою.

Поділитися

Чи була ця стаття корисною для вас?

Популярні пропозиції VPS

-22.2%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 4096 HK Linux

33

При оплаті за рік

-12.3%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-wKVM-SSD 16384 Windows

237

При оплаті за рік

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 16384 Linux

52

При оплаті за рік

-9.7%

CPU
CPU
10 Epyc Cores
RAM
RAM
64 GB
Space
Space
300 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 65536 Windows

193

При оплаті за рік

-18.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
2 TB
wKVM-SSD 2048 Metered Windows

24

При оплаті за рік

CPU
CPU
6 Epyc Cores
RAM
RAM
8 GB
Space
Space
100 GB NVMe
Bandwidth
Bandwidth
Unlimited
Keitaro KVM 8192
OS
CentOS
Software
Software
Keitaro

При оплаті за місяць

-8.1%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 8192 Windows

31.9

При оплаті за рік

-5%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
40 GB HDD
Bandwidth
Bandwidth
Unlimited
wKVM-HDD 1024 Windows

12.1

При оплаті за рік

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
Keitaro KVM 32768
OS
CentOS
Software
Software
Keitaro

При оплаті за місяць

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-KVM-SSD 2048 Linux

30.3

При оплаті за рік

Інші статті на цю тему

cookie

Чи приймаєте ви файли cookie та політику конфіденційності?

Ми використовуємо файли cookie, щоб забезпечити вам найкращий досвід роботи на нашому сайті. Якщо ви продовжуєте користуватися сайтом, не змінюючи налаштувань, вважайте, що ви згодні на отримання всіх файлів cookie на сайті HostZealot.