Рекордна продуктивність: 17 000 токенів на секунду у нового рішення від стартапу Taalas

watch 7s
views 2

15:13, 20.02.2026

Нещодавно стартап з Канади Taalas повідомив про свій перший продукт – чип HC1 з Llama 3.1 8B. Особливість підходу компанії полягає в тому, що модель не завантажується в пам'ять, а безпосередньо впаюється в кремній на етапі виробництва. Внаслідок чого можна досягти рекордного результату в 17 000 токенів в секунду на одного користувача. Такий результат майже в 10 разів швидший за рішення на GPU, а також досягається значна економія енергії і мінімізується вартість виробництва.

Компанія Taalas

Стартап заснували Любіша Баїч, колишній директор з проектування інтегральних схем в AMD, його дружина Лейла Баїч (колишній технологічний менеджер та інженер в AMD, ATI, Altera) і Драго Ігнятович (колишній директор з ASIC-дизайну в AMD).

Основний підхід компанії можна назвати тотальною специфікацією. Для кожної моделі компанія планує виробляти окремий чип. Мікросхема складатиметься приблизно зі 100 шарів, і лише 2 верхні будуть кастомізовані належним чином, в них вбудовується mask ROM recall fabric. Таким чином можна буде випускати чип за 2 місяці замість 6. Також обчислення і пам'ять будуть об'єднані на одному кристалі.

На даному етапі така агресивна квантизація знижує якість у порівнянні з GPU-бенчмарками. Стартап визнає цей факт, тому і позиціонує продукт як бета-сервіс. Мінімальна гнучкість чипа зберігається завдяки можливості донавчання через LaRA-адаптери та наявності контекстного вікна.

Компанія залучила інвестицій на суму $200 млн і планує незабаром випустити новий чип середнього розміру, а ближче до кінця року можливий запуск на платформі HC2 передової LLM.

Сподіваємося, стаття виявилася корисною - а як ви вважаєте? Поставте лайк і підпишіться на наш блог, щоб отримувати більше практичних порад і останніх новин про технології від HostZealot.

Поділитися

Чи була ця стаття корисною для вас?

Популярні пропозиції VPS

-22.2%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 4096 HK Linux

33

При оплаті за рік

-10%

CPU
CPU
4 Epyc Cores
RAM
RAM
4 GB
Space
Space
50 GB NVMe
Bandwidth
Bandwidth
Unlimited
aiKVM-NVMe 4096 Linux

16.62

При оплаті за рік

-20.2%

CPU
CPU
1 Xeon Core
RAM
RAM
1 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
300 GB
wKVM-SSD 1024 HK Windows

19

При оплаті за рік

-10%

CPU
CPU
3 Epyc Cores
RAM
RAM
2 GB
Space
Space
20 GB NVMe
Bandwidth
Bandwidth
Unlimited
aiKVM-NVMe 2048 Linux

8.89

При оплаті за рік

-5%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
40 GB HDD
Bandwidth
Bandwidth
Unlimited
wKVM-HDD 1024 Windows

12.1

При оплаті за рік

-10%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 32768 Linux

69.99

При оплаті за рік

-20.8%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
10 TB
wKVM-SSD 16384 Metered Windows

100

При оплаті за рік

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-KVM-SSD 4096 Linux

60.5

При оплаті за рік

-9.2%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-wKVM-SSD 4096 Windows

72

При оплаті за рік

-26.7%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
20 GB SSD
Bandwidth
Bandwidth
1 TB
KVM-SSD 1024 Metered Linux

10

При оплаті за рік

Інші статті на цю тему

cookie

Чи приймаєте ви файли cookie та політику конфіденційності?

Ми використовуємо файли cookie, щоб забезпечити вам найкращий досвід роботи на нашому сайті. Якщо ви продовжуєте користуватися сайтом, не змінюючи налаштувань, вважайте, що ви згодні на отримання всіх файлів cookie на сайті HostZealot.