Випуск ChatGPT Image 2.0: новий рівень генерації тексту на зображеннях
14:48, 22.04.2026
Нещодавно OpenAI презентувала ChatGPT Image 2.0 - модель, яка чудово справляється з відтворенням тексту на зображеннях. Завдяки новому підходу можна створювати зображення високої якості без будь-яких додаткових правок.
Особливості різних моделей ШІ
Розробка дифузних моделей ШІ здійснюється вже досить тривалий час, але всі попередні варіанти значно спотворювали написи. Найчастіше моделі були орієнтовані на створення патерна, а текст займав мінімальну частину площі.
Далі дослідники почали тестувати авторегресійні моделі, які функціонують за принципом передбачення змісту зображень.
У OpenAI поки що не розголошують деталі щодо архітектури новинки. На даному етапі відомо, що Images 2.0 може одночасно генерувати кілька зображень, шукати дані в інтернеті і навіть перевіряти отримані результати. Внаслідок цього нова модель справляється з генерацією маркетингових матеріалів різних розмірів, а також може працювати з нелатинськими шрифтами. Єдиним негативним моментом є те, що дані Images 2.0 обмежені груднем 2025 року, внаслідок чого можуть бути певні неточності у запитах щодо недавніх подій.
Нова модель генерує складні композиції, короткі тексти, елементи інтерфейсу, але генерація результату відбувається трохи довше, ніж у випадку зі стандартним текстовим запитом.
Усі користувачі Codex і ChatGPT отримають доступ до нової моделі, а платні користувачі зможуть створювати більш складні зображення. Більше того, планується відкриття програмного інтерфейсу (API) gpt-image-2, де вартість залежатиме від роздільної здатності та якості зображення.
Сподіваємося, стаття виявилася корисною - а як ви вважаєте? Поставте лайк і підпишіться на наш блог, щоб отримувати більше практичних порад та останніх новин про технології від HostZealot.