Red Hat запускає llm-d - платформу для масштабованого виведення ШІ на базі Kubernetes

watch 9s
views 2

15:27, 22.05.2025

Зміст статті
arrow

  • Ключові особливості llm-d
  • Співпраця провідних гравців ШІ-індустрії
  • Технологічна основа та архітектура

Red Hat представила llm-d — новий open source-проєкт, призначений для високопродуктивного розподіленого виведення великих мовних моделей (LLM). Платформа розроблена на базі Kubernetes і орієнтована на спрощення масштабування генеративного ШІ. Вихідний код доступний на GitHub під ліцензією Apache 2.0.

Ключові особливості llm-d

Серед головних функцій платформи:

  • оптимізований планувальник виведення (Inference Scheduler) для vLLM;
  • дезагрегована архітектура обслуговування;
  • повторне використання префіксних кешів;
  • гнучке масштабування залежно від трафіку, завдань і доступних ресурсів.

Співпраця провідних гравців ШІ-індустрії

Розробка ведеться в партнерстві з такими компаніями, як Nvidia, AMD, Intel, IBM Research, Google Cloud, CoreWeave, Hugging Face та іншими. Така співпраця підкреслює серйозність підходу до llm-d і потенціал платформи як галузевого стандарту.

Технологічна основа та архітектура

Проєкт використовує бібліотеку vLLM для розподіленого inference, а також такі компоненти, як LMCache для вивантаження KV-кешу, інтелектуальну маршрутизацію трафіку з підтримкою ШІ, високоефективні комунікаційні API та автоматичне масштабування під навантаження й інфраструктуру.

Усе це дає змогу адаптувати систему під різні сценарії використання та вимоги до продуктивності. А сам запуск llm-d може стати значним кроком у бік демократизації потужних ШІ-систем та їхньої доступності для широкої аудиторії розробників і дослідників.

Поділитися

Чи була ця стаття корисною для вас?

Популярні пропозиції VPS

-10%

CPU
CPU
6 Epyc Cores
RAM
RAM
8 GB
Space
Space
100 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 8192 Windows

28.99

При оплаті за рік

-10%

CPU
CPU
4 Epyc Cores
RAM
RAM
4 GB
Space
Space
50 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 4096 Linux

16.45

При оплаті за рік

-21.5%

CPU
CPU
2 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
300 GB
wKVM-SSD 4096 HK Windows

40

При оплаті за рік

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 4096 Linux

15.95

При оплаті за рік

-9.7%

CPU
CPU
10 Xeon Cores
RAM
RAM
64 GB
Space
Space
300 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 65536 Windows

138.99

При оплаті за рік

-15.5%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
80 Mbps
DDoS Protected SSD-KVM 8192 Linux

95

При оплаті за рік

-24.7%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
4 TB
KVM-SSD 4096 Metered Linux

31

При оплаті за рік

-9.5%

CPU
CPU
4 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-wKVM-SSD 8192 Windows

121.5

При оплаті за рік

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 8192 Windows

28.44

При оплаті за рік

-4.7%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
40 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 1024 Windows

10.37

При оплаті за рік

Інші статті на цю тему

cookie

Чи приймаєте ви файли cookie та політику конфіденційності?

Ми використовуємо файли cookie, щоб забезпечити вам найкращий досвід роботи на нашому сайті. Якщо ви продовжуєте користуватися сайтом, не змінюючи налаштувань, вважайте, що ви згодні на отримання всіх файлів cookie на сайті HostZealot.