Вийшла Claude Opus 4.5
16:58, 25.11.2025
24 листопада вийшла модель Claude Opus 4.5 від Anthropic. На даному етапі компанія вважає її найпотужнішою опцією для управління комп'ютером, агентних сценаріїв і програмування. Крім того, модель значно покращили, і тепер вона може працювати з таблицями, презентаціями та аналізувати інформацію оптимальніше.
Модель вже доступна на 3 великих хмарних платформах, в додатках Anthropic і через Claude API. Зараз ціна за використання становить – 5 доларів за мільйон вхідних токенів і 25 доларів за мільйон вихідних токенів.
Крім того, компанія здійснила оновлення Claude Code, Claude Developer Platform і користувацьких додатків. З'явився десктопний сценарій використання, інструменти для довгоживучих агентів і інтеграція з Chrome/Excel. Також, за рахунок автоматичного згортання попереднього контексту можна продовжити довжину діалогу в додатках Claude.
Перше враження від використання
При тестуванні в Anthropic, модель моментально справляється з неоднозначними завданнями, самостійно аналізує складні ситуації і зважує компроміси без детальних підказок. Модель тестували на внутрішній бенчмарк, і за 2 години вона показала кращий результат, ніж будь-яка людина, яка проходила той самий тест.
Даний тест орієнтований на перевірку якості і техніки вирішення в дуже стислих часових рамках. Claude Opus 4.5 обганяє найсильніших експертів, які складали цей тест на позицію performance-інженерів.
Opus 4.5 має кращі характеристики з міркування, зору і математики, якщо порівнювати з попередніми версіями. Також, модель показує топові результати в 7 з 8 мов програмування.
Узгодженість і безпека
На сьогоднішній день, Claude Opus 4.5 вважається найбезпечнішою моделлю і топовою в узгодженості. При використанні моделі в критичних сценаріях, очікується, що вона не зламається при атаці хакерів. У проекті значно посилили стійкість до prompt injection – наявності в запиті шкідливих прихованих інструкцій.
Новинки в Claude Developer Platform
Модель вирішує завдання за значно меншу кількість кроків і витрачає менше токенів, ніж попередні версії.
У Claude API з'явився параметр effort, за допомогою якого можна використовувати максимальну глибину роздумів або вибрати опцію економії токенів і часу. На середньому рівні effort Opus 4.5 показує кращі результати, ніж Sonnet 4.5, і використовує менше вихідних токенів.
Через стиснення контексту, управління «зусиллями», модель закриває більше завдань і не потребує великої кількості ручного втручання.
Developer Platform поступово перетворюється на конструктор, з якого можна створити свою систему з контролем над інструментами, ефективністю та управлінням контекстом.