GPT-4.5: новий етап у розвитку мовних моделей

watch 12s
views 2

18:39, 28.02.2025

Випущено нову мовну модель GPT-4.5, яка буде природнішою ніж попередні версії, але цінова політика буде вищою.

Наразі GPT-4.5 доступний як «Research Preview» для розробників та юзерів Pro версії. Наступного тижня планується відкриття доступу для юзерів Team і Plus.

Значна відмінність версії GPT-4.5 від моделі o3-mini та о1 полягає в тому, що нова версія відповідає набагато швидше через зміни в підході до «неконтрольованого навчання». Оскільки нова модель не думає перед відповіддю, продуктивність значно збільшилася.

GPT-4.5 також відома під назвою Orion і є найбільшою навченою моделлю на даний момент. OpenAI заявляють, що нова модель не буде «прикордонною» такі заяви від компанії, можливо, пов'язані з навчанням ще однієї моделі о3.

Ціна модель значно вища за версію GPT-4o і о1 і становить $75 (за мільйон вхідних токенів) і $150 (за мільйон вихідних). Як і попередні версії, цей варіант матиме довжину контексту в 128 000 токенів.

У компанії OpenAI заявили, що 2 основні підходи (розмірковування і навчання) будуть використовуватися як взаємодоповнювані варіанти. Версія 4.5 вже стала значно інтелектуальнішою через попереднє навчання. Також є велика можливість, що нова версія GPT-5 зможе об'єднати ці 2 можливості.

Результати бенчмаркінгу

Що стосується тестів продуктивності, то модель 4.5 показує хороші результати і досягає 62.5% за SimpleQA. У тому ж тесті Grok 3 показав результат у 43.6%, а GPT-4o - 43,6%. Рівень галюцинацій також значно знижений до рекордних 37,1%. Також нова версія 4.5 домінує в тестах на оцінку людей у повсякденних питаннях, творчому інтелекті, і професійних питаннях.

У тестах STEM результати варіюються від моделей. Наприклад, у тесті AIME '24 модель 4.5 показує результат у 36,7%, o3-mini - 87,3% і GPT-4o - 9,3%. У тесті SWE-Bench Verified результат становить 38,8%, у той час як o3-mini - 61,0% а GPT-4o - 30,7%.

Якщо порівнювати результати всіх бенчмарків, то показники доволі стабільні і немає значного стрибка в продуктивності як показав SimpleQA.

Поділитися

Чи була ця стаття корисною для вас?

Популярні пропозиції VPS

-8.1%

CPU
CPU
4 Epyc Cores
RAM
RAM
4 GB
Space
Space
50 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 4096 Windows

31.9

При оплаті за рік

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-KVM-SSD 4096 Linux

60.5

При оплаті за рік

-9.1%

CPU
CPU
6 Epyc Cores
RAM
RAM
16 GB
Space
Space
150 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 16384 Windows

66.5

При оплаті за рік

-22.2%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 4096 HK Linux

33

При оплаті за рік

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
400 GB HDD
Bandwidth
Bandwidth
Unlimited
KVM-HDD 16384 Linux

50

При оплаті за рік

-13.1%

CPU
CPU
2 Xeon Cores
RAM
RAM
512 MB
Space
Space
10 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 512 HK Linux

7

При оплаті за рік

-10%

CPU
CPU
2 Xeon Cores
RAM
RAM
512 MB
Space
Space
10 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 512 Linux

5.2

При оплаті за рік

CPU
CPU
10 Epyc Cores
RAM
RAM
64GB
Space
Space
400 GB NVMe
Bandwidth
Bandwidth
Unlimited
Keitaro KVM 65536
OS
CentOS
Software
Software
Keitaro

При оплаті за місяць

-18.6%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
4 TB
wKVM-SSD 4096 Metered Windows

38

При оплаті за рік

-15.4%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
100 Mbps
DDoS Protected SSD-wKVM 16384 Windows

130

При оплаті за рік

Інші статті на цю тему

cookie

Чи приймаєте ви файли cookie та політику конфіденційності?

Ми використовуємо файли cookie, щоб забезпечити вам найкращий досвід роботи на нашому сайті. Якщо ви продовжуєте користуватися сайтом, не змінюючи налаштувань, вважайте, що ви згодні на отримання всіх файлів cookie на сайті HostZealot.