NVLM 1.0 від NVIDIA: Потужна альтернатива GPT-4o з вражаючими результатами

watch 7s
views 2

14:57, 19.09.2024

NVIDIA анонсувала нове сімейство мультимодальних моделей NVLM (NVIDIA Vision Language Model), які демонструють чудові результати в різноманітних візуальних та мовних завданнях. Сімейство включає три основні моделі: NVLM-D (модель тільки з декодером), NVLM-X (модель X-attention) і NVLM-H (гібридна модель), кожна з яких доступна в конфігураціях з 34 і 72 мільярдами параметрів.

Однією з ключових особливостей моделей є їхня здатність ефективно справлятися з візуальними завданнями. У тесті OCRBench, який перевіряє здатність розпізнавати текст із зображень, модель NVLM-D перевершила GPT-4o від OpenAI, що є важливим проривом у сфері мультимодальних рішень. Крім того, моделі здатні розуміти меми, розбирати людський почерк і відповідати на питання, що вимагають точного аналізу розташування об'єктів на зображеннях.

NVLM також добре показують себе в математичних задачах, де вони випереджають моделі Google і лише на три пункти відстають від лідера, моделі Claude 3.5, розробленої стартапом Anthropic.

Кожна з трьох моделей має свої особливості.

  • NVLM-D використовує попередньо навчений кодер і двошаровий персептрон, що робить його економічно ефективним, але вимагає більше ресурсів графічного процесора.
  • NVLM-X використовує механізм перехресної уваги, який краще обробляє зображення з високою роздільною здатністю
  • NVLM-H поєднує переваги обох моделей, забезпечуючи баланс між ефективністю та точністю.

NVIDIA продовжує зміцнювати свої позиції в галузі штучного інтелекту, надаючи рішення, які можуть бути корисними як для досліджень, так і для бізнесу.

Поділитися

Чи була ця стаття корисною для вас?

Популярні пропозиції VPS

-10%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
12 TB
KVM-SSD 32768 Metered Linux

150

При оплаті за рік

-10%

CPU
CPU
3 Epyc Cores
RAM
RAM
2 GB
Space
Space
20 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 2048 Linux

8.8

При оплаті за рік

-24.7%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
4 TB
KVM-SSD 4096 Metered Linux

31

При оплаті за рік

-20.5%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
8 TB
KVM-SSD 8192 Metered Linux

57

При оплаті за рік

-10%

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 32768 Linux

70.49

При оплаті за рік

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB HDD
Bandwidth
Bandwidth
Unlimited
KVM-HDD 4096 Linux

15

При оплаті за рік

-9.9%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
40 GB HDD
Bandwidth
Bandwidth
300 Gb
KVM-HDD HK 1024 Linux

4.85

При оплаті за рік

-13.1%

CPU
CPU
2 Xeon Cores
RAM
RAM
512 MB
Space
Space
10 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 512 HK Linux

7

При оплаті за рік

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-KVM-SSD 4096 Linux

60.5

При оплаті за рік

-15.6%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
20 GB SSD
Bandwidth
Bandwidth
30 Mbps
DDoS Protected SSD-KVM 1024 Linux

38

При оплаті за рік

Інші статті на цю тему

cookie

Чи приймаєте ви файли cookie та політику конфіденційності?

Ми використовуємо файли cookie, щоб забезпечити вам найкращий досвід роботи на нашому сайті. Якщо ви продовжуєте користуватися сайтом, не змінюючи налаштувань, вважайте, що ви згодні на отримання всіх файлів cookie на сайті HostZealot.