Red Hat запускає llm-d - платформу для масштабованого виведення ШІ на базі Kubernetes

watch 9s
views 2

15:27, 22.05.2025

Зміст статті
arrow

  • Ключові особливості llm-d
  • Співпраця провідних гравців ШІ-індустрії
  • Технологічна основа та архітектура

Red Hat представила llm-d — новий open source-проєкт, призначений для високопродуктивного розподіленого виведення великих мовних моделей (LLM). Платформа розроблена на базі Kubernetes і орієнтована на спрощення масштабування генеративного ШІ. Вихідний код доступний на GitHub під ліцензією Apache 2.0.

Ключові особливості llm-d

Серед головних функцій платформи:

  • оптимізований планувальник виведення (Inference Scheduler) для vLLM;
  • дезагрегована архітектура обслуговування;
  • повторне використання префіксних кешів;
  • гнучке масштабування залежно від трафіку, завдань і доступних ресурсів.

Співпраця провідних гравців ШІ-індустрії

Розробка ведеться в партнерстві з такими компаніями, як Nvidia, AMD, Intel, IBM Research, Google Cloud, CoreWeave, Hugging Face та іншими. Така співпраця підкреслює серйозність підходу до llm-d і потенціал платформи як галузевого стандарту.

Технологічна основа та архітектура

Проєкт використовує бібліотеку vLLM для розподіленого inference, а також такі компоненти, як LMCache для вивантаження KV-кешу, інтелектуальну маршрутизацію трафіку з підтримкою ШІ, високоефективні комунікаційні API та автоматичне масштабування під навантаження й інфраструктуру.

Усе це дає змогу адаптувати систему під різні сценарії використання та вимоги до продуктивності. А сам запуск llm-d може стати значним кроком у бік демократизації потужних ШІ-систем та їхньої доступності для широкої аудиторії розробників і дослідників.

Поділитися

Чи була ця стаття корисною для вас?

Популярні пропозиції VPS

-7.3%

CPU
CPU
3 Epyc Cores
RAM
RAM
2 GB
Space
Space
25 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 2048 Windows

22

При оплаті за рік

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 16384 Linux

52

При оплаті за рік

-10%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
20 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 1024 Linux

6.6

При оплаті за рік

-9.5%

CPU
CPU
4 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-wKVM-SSD 8192 Windows

121.5

При оплаті за рік

-26.7%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
20 GB SSD
Bandwidth
Bandwidth
1 TB
KVM-SSD 1024 Metered Linux

10

При оплаті за рік

-15.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
60 Mbps
DDoS Protected SSD-wKVM 4096 Windows

73

При оплаті за рік

-10%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 32768 Linux

93.5

При оплаті за рік

-29.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
2 TB
KVM-SSD 2048 Metered Linux

17

При оплаті за рік

-13.1%

CPU
CPU
2 Xeon Cores
RAM
RAM
512 MB
Space
Space
10 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 512 HK Linux

7

При оплаті за рік

-9.1%

CPU
CPU
6 Epyc Cores
RAM
RAM
16 GB
Space
Space
150 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 16384 Windows

66.5

При оплаті за рік

Інші статті на цю тему

cookie

Чи приймаєте ви файли cookie та політику конфіденційності?

Ми використовуємо файли cookie, щоб забезпечити вам найкращий досвід роботи на нашому сайті. Якщо ви продовжуєте користуватися сайтом, не змінюючи налаштувань, вважайте, що ви згодні на отримання всіх файлів cookie на сайті HostZealot.