GPT-4.5: новий етап у розвитку мовних моделей

watch 12s
views 2

18:39, 28.02.2025

Випущено нову мовну модель GPT-4.5, яка буде природнішою ніж попередні версії, але цінова політика буде вищою.

Наразі GPT-4.5 доступний як «Research Preview» для розробників та юзерів Pro версії. Наступного тижня планується відкриття доступу для юзерів Team і Plus.

Значна відмінність версії GPT-4.5 від моделі o3-mini та о1 полягає в тому, що нова версія відповідає набагато швидше через зміни в підході до «неконтрольованого навчання». Оскільки нова модель не думає перед відповіддю, продуктивність значно збільшилася.

GPT-4.5 також відома під назвою Orion і є найбільшою навченою моделлю на даний момент. OpenAI заявляють, що нова модель не буде «прикордонною» такі заяви від компанії, можливо, пов'язані з навчанням ще однієї моделі о3.

Ціна модель значно вища за версію GPT-4o і о1 і становить $75 (за мільйон вхідних токенів) і $150 (за мільйон вихідних). Як і попередні версії, цей варіант матиме довжину контексту в 128 000 токенів.

У компанії OpenAI заявили, що 2 основні підходи (розмірковування і навчання) будуть використовуватися як взаємодоповнювані варіанти. Версія 4.5 вже стала значно інтелектуальнішою через попереднє навчання. Також є велика можливість, що нова версія GPT-5 зможе об'єднати ці 2 можливості.

Результати бенчмаркінгу

Що стосується тестів продуктивності, то модель 4.5 показує хороші результати і досягає 62.5% за SimpleQA. У тому ж тесті Grok 3 показав результат у 43.6%, а GPT-4o - 43,6%. Рівень галюцинацій також значно знижений до рекордних 37,1%. Також нова версія 4.5 домінує в тестах на оцінку людей у повсякденних питаннях, творчому інтелекті, і професійних питаннях.

У тестах STEM результати варіюються від моделей. Наприклад, у тесті AIME '24 модель 4.5 показує результат у 36,7%, o3-mini - 87,3% і GPT-4o - 9,3%. У тесті SWE-Bench Verified результат становить 38,8%, у той час як o3-mini - 61,0% а GPT-4o - 30,7%.

Якщо порівнювати результати всіх бенчмарків, то показники доволі стабільні і немає значного стрибка в продуктивності як показав SimpleQA.

Поділитися

Чи була ця стаття корисною для вас?

Популярні пропозиції VPS

-7.9%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
200 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 8192 Windows

25.95

При оплаті за рік

-21.5%

CPU
CPU
2 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
300 GB
wKVM-SSD 4096 HK Windows

40

При оплаті за рік

-29.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
2 TB
KVM-SSD 2048 Metered Linux

17

При оплаті за рік

-10%

CPU
CPU
4 Epyc Cores
RAM
RAM
4 GB
Space
Space
50 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 4096 Linux

25.9

При оплаті за рік

-12.3%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-wKVM-SSD 16384 Windows

237

При оплаті за рік

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
60 GB HDD
Bandwidth
Bandwidth
300 Gb
KVM-HDD HK 2048 Linux

6.27

При оплаті за рік

-8.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-wKVM-SSD 2048 Windows

37.4

При оплаті за рік

-15.3%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
40 Mbps
DDoS Protected SSD-wKVM 2048 Windows

54

При оплаті за рік

-9.4%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 32768 Windows

99.5

При оплаті за рік

-16.2%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
60 Mbps
DDoS Protected SSD-KVM 4096 Linux

67

При оплаті за рік

Інші статті на цю тему

cookie

Чи приймаєте ви файли cookie та політику конфіденційності?

Ми використовуємо файли cookie, щоб забезпечити вам найкращий досвід роботи на нашому сайті. Якщо ви продовжуєте користуватися сайтом, не змінюючи налаштувань, вважайте, що ви згодні на отримання всіх файлів cookie на сайті HostZealot.