OpenAI анонсувала ChatGPT Images 2.0 — новий рівень генерації зображень

ВІСНИК.Академія22 Квітня, 202658 Views

Компанія OpenAI розпочала впровадження оновленої версії свого візуального інструмента ChatGPT Images 2, який отримав революційну здатність до «мислення». 

Про це, як повідомляє ua.news, пише The Verge.

Тепер модель може використовувати веб-пошук для глибшого аналізу запиту, що дозволяє створювати серії зображень із високою точністю та деталізацією.

Головною особливістю оновлення стала можливість генератора аналізувати структуру майбутнього малюнка перед початком роботи. 

Це дозволяє моделі краще дотримуватися складних інструкцій, зберігати специфічні деталі та значно якісніше відтворювати текстові написи безпосередньо на зображеннях.

Функції інтелектуального аналізу наразі доступні для передплатників рівнів Plus, Pro, Business та Enterprise. 

У цьому режимі ChatGPT Images 2 може самостійно шукати інформацію в інтернеті для візуалізації конкретних концепцій або створювати пояснювальні схеми на основі файлів, завантажених користувачем.

У режимі «мислення» система здатна генерувати до восьми зображень одночасно, суворо дотримуючись єдиної стилістики. 

Це відкриває нові можливості для авторів коміксів та дизайнерів, оскільки модель навчилася зберігати ідентичність персонажів та об’єктів у різних сценах.

Водночас базові оновлення стали доступними для ширшого кола користувачів сервісу. 

Генератор суттєво покращив навички передачі ключових рис облич на фотографіях, а також отримав спеціалізовані налаштування для роботи з піксель-артом, манґою та складними кінематографічними композиціями.

Технічні характеристики оновленої версії передбачають підтримку роздільної здатності до 2K. 

Крім того, розробники розширили перелік доступних форматів — тепер користувачі можуть створювати зображення від панорамних (3:1) до вузьких вертикальних (1:3).

Окрему увагу OpenAI приділила мультимовній підтримці текстових написів усередині генерацій. Окрім традиційно якісної англійської, модель тепер значно краще відтворює японську, корейську, китайську мови, а також гінді та бенгальську.

Експерти ринку вважають, що інтеграція веб-пошуку безпосередньо у процес створення візуального контенту є значним кроком уперед. 

Це дозволяє ШІ не просто фантазувати, а спиратися на реальні факти та актуальні візуальні дані під час виконання запитів користувача.

Leave a Reply Скасувати коментар