Результати бенчмарків Grok 4.1 Fast і деталі щодо Agent Tools API
16:51, 24.11.2025
Команда xAI поділилася результатами бенчмарків, на яких Grok 4.1 Fast стає лідером серед своїх конкурентів. Крім того, розробники детальніше розповіли про інфраструктуру Agent Tools API.
Grok 4.1 Fast займає лідируючу позицію
Виходячи з оновленої інформації по бенчмарках від xAI, Grok 4.1 Fast займає лідируючі позиції в таких категоріях:
- τ²-bench Telecom: в даній категорії нова модель показує максимально можливий 100% результат і значно випереджає Claude Sonnet 4.5, GPT-5.1, і Grok 4.
- Berkeley Function Calling v4: нова модель показує 72% в категорії точності при низькій вартості і також стає лідером.
- Довгий контекст: модель зберігає стабільну якість до 2-мільйонного контекстного вікна. Наприклад, в даній категорії нова модель показує результат в 67%, а Grok 4 всього 22%.
Agent Tools API – інструменти для автономних агентів
Agent Tools API – це набір серверних інструментів, які надають доступ до зовнішніх операцій і реальних даних.
За допомогою API агент може:
- Комбінувати кілька інструментів у ланцюжку автоматично.
- Використовувати інтелектуальний пошук у завантаженому документі.
- Підключатися до зовнішніх MCP-серверів.
- Здійснювати пошук даних в X в реальному часі.
- Запуск коду Python в безпечному середовищі.
Особливістю інструментів є те, що вони повністю функціонують на інфраструктурі xAI. Таким чином, немає необхідності керувати середовищами, ключами або лімітами, Grok самостійно визначає, які кроки потрібні, і викликає необхідний інструмент, також можуть здійснюватися паралельні виклики.
На даний момент є доступ до 2 варіантів моделі: reasoning для завдань з глибоким міркуванням і non-reasoning для миттєвих відповідей. Інструмент Agent Tools API знаходиться у вільному доступі для користувачів xAI, а модель буде безкоштовною до 3 грудня.