Як користуватися ChatGPT Images 2.0? Практичний тест меню з яловичим раменом, обкладинок журналів, ефекту багатомовної популяризації

robot
Генерація анотацій у процесі

OpenAI випустила інструмент для створення зображень ChatGPT Images 2.0, який відзначається потужними можливостями складного форматування та обробки багатомовного тексту (включаючи китайську), у цій статті буде детально представлено функції, особливості, безкоштовні та платні плани, а також результати тестового генерування.

Що таке ChatGPT Images 2.0? Основні функції та особливості!

З’явився інструмент для створення AI-зображень, здатний конкурувати з Gemini Nano Banana 2? OpenAI оголосила про запуск ChatGPT Images 2.0, який працює на новій моделі GPT Image 2, орієнтованій на високоякісне зображення з можливістю вибору, розташування та викриття інформації. Нижче наведено три головні особливості ChatGPT Images 2.0:

Потужне форматування та обробка багатомовного тексту

Першою очевидною особливістю є значне покращення можливостей форматування та обробки багатомовного тексту у ChatGPT Images 2.0.

Згідно з іноземним виданням Techcrunch, раніше більшість інструментів для генерації зображень на основі AI використовували дифузійні моделі, які часто стикалися з труднощами при написанні тексту. ChatGPT Images 2.0 здатен точно відтворювати дрібний текст, іконки та елементи інтерфейсу користувача.

OpenAI заявляє, що Images 2.0 демонструє значний прогрес у роботі з мовами, що не використовують латинський алфавіт, включаючи китайську, японську, корейську, хінді та бенгальську, і може генерувати їх з високою чіткістю у зображеннях.

Джерело: офіційний приклад генерації ChatGPT Images 2.0 від OpenAI

Нові можливості мислення та пошук у мережі

Крім форматування та обробки багатомовного тексту, ChatGPT Images 2.0 пропонує нові можливості мислення, зокрема, здатність здійснювати пошук у мережі для допомоги у створенні зображень. Модель оновлена до знань станом на грудень 2025 року, що допомагає генерувати контент, пов’язаний із недавніми подіями.

Джерело: офіційний приклад генерації ChatGPT Images 2.0 від OpenAI

Підтримка 2K роздільної здатності та різноманітних співвідношень сторін

ChatGPT Images 2.0 підтримує створення зображень з роздільною здатністю до 2K і пропонує широкий вибір співвідношень сторін, від широкоформатних 3:1 до довгих 1:3.

Керівник досліджень OpenAI Бойуань Чен (Boyuan Chen) зазначив, що архітектура Images 2.0 вже повністю оновлена і є універсальною моделлю, яка за допомогою простих текстових підказок може виконувати перетворення перспективи у стилі 3D та складне просторове логіку.

Функції безкоштовних та платних планів ChatGPT Images 2.0

Чи вартує заощаджень? Різні рівні платних користувачів ChatGPT Images 2.0 мають доступ до різних функцій, що наведено нижче:

  • Безкоштовні користувачі: наразі можуть використовувати базову модель ImageGen 2.0 для стандартних завдань з генерації зображень. Базова версія вже включає багато ключових оновлень, таких як кращий слідування інструкціям, потужніший рендеринг тексту, багатомовна підтримка та різноманітні співвідношення сторін.
  • Користувачі ChatGPT Plus, Business та Enterprise: ці платні користувачі можуть активувати нову модель мислення. У цьому режимі генератор зображень використовує пошук у мережі, створює візуальні пояснення на основі завантажених файлів і перед створенням зображень виконує структурне логіку. Одночасно можна генерувати до 8 зображень і забезпечити узгодженість персонажів, об’єктів і стилів у сценах.
  • Користувачі Pro: отримують доступ до більш просунутої моделі ImageGen Pro. Хоча OpenAI ще не оприлюднила точні деталі різниці між Pro та функцією мислення, корпоративні користувачі можуть вважати цю функцію суттєвим оновленням, корисним для створення фактологічних пояснень, перетворення внутрішніх документів у ілюстрації або збереження візуальної узгодженості у кількох активів.
  • Розробники API: тепер можуть інтегрувати модель gpt-image-2 з підтримкою високої роздільної здатності та гнучких співвідношень сторін.

Тестування ChatGPT Images 2.0: меню, журнали, ілюстрації та графіки

Як показує практика, чи відповідає реальна робота ChatGPT Images 2.0 заявам OpenAI? Проведемо тест.

Тест меню ресторану з м’ясом яловичини

Редактор «Крипто Місто» протестував безкоштовний план ChatGPT, створивши меню тайванської кухні з м’ясом яловичини, використовуючи простий запит: «Згенеруй мені меню з тайванським м’ясом яловичини, де назви страв, ціни та зображення будуть на традиційній китайській мові.»

Ось результати:

Джерело: згенеровано ChatGPT Images 2.0

З точки зору можливостей безкоштовної версії, результат виглядає досить добре, хоча при уважнішому розгляді видно, що при обробці складних каліграфічних китайських символів у зображеннях все ще трапляються помилки у написанні. Можливо, платна версія дасть кращий результат.

Крім того, ціна відповідає приблизно ціновій політиці у Тайбеї для м’ясних страв, і можна безкоштовно додати один повторний порційний обід.

Якщо ж ви плануєте друкувати меню, найкращим варіантом є перетворення згенерованих зображень у векторний формат (наприклад, EPS, .ai для Adobe Illustrator або PDF) і використання кольору CMYK, що оптимально для друку. Хоча друкарні можуть приймати JPG або PNG, для високоякісного друку краще мати векторний формат, щоб мати можливість коригувати зображення.

Тест обкладинки наукового журналу

Наступним тестом стала обкладинка наукового журналу з складним форматуванням. Запит був: «Згенеруй мені обкладинку технологічного журналу з традиційною китайською мовою, назва журналу — “Крипто Місто”, тема — “Перехрестя блокчейну та AI”, ця обкладинка має містити заголовок, номер випуску, дату передбачуваного терміну у верхній частині штрих-коду, усі тексти мають бути чіткими та професійно вирівняними.»

Ось результати:

Джерело: згенеровано ChatGPT Images 2.0

Результат схожий на попередній — з першим погляд здається непогано, але при уважному розгляді видно, що при обробці складних каліграфічних китайських символів все ще трапляються помилки. Шрифт на обкладинці дуже нагадує шрифт “Jin Xuan” від тайванської компанії Justfont, можливо, він ліцензований.

Такі питання виникали й у «Крипто Місто» під час запуску Nano Banana Pro.

  • **Стаття:**Nano Banana Pro тестування: китайські символи покращилися! Але з’явилися сумніви щодо авторських прав на анімацію та шрифти

Тест багатомовних ілюстраційних графіків

«Крипто Місто» протестувало графік причин землетрусу, зроблений з використанням традиційної китайської, японської та корейської мови. Складний багатомовний текст був частково успішним у рендерингу. У форматуванні враховувалися мовні особливості, зокрема, різні кольори для різних мов. Однак при уважному розгляді деякі складні каліграфічні китайські символи, ієрогліфи або корейські літери залишаються розмитими.

Ось результати:

Джерело: згенеровано ChatGPT Images 2.0

Зображення 2.0 зберігає узгодженість персонажів і об’єктів, вирішує складні процеси

Крім того, Images 2.0, як і Nano Banana 2, має можливість редагування: натиснувши «Редагувати» зліва від згенерованого зображення, можна почати редагування, зберігаючи узгодженість персонажів і об’єктів. Це робить створення коміксів, серій для соцмереж або планів кімнат у будинках значно простішим.

Керівник продукту ChatGPT Images Адель Лі зазначила, що ця функція вирішує проблему, коли користувачам доводиться створювати окремі зображення та вручну їх з’єднувати, що було досить клопітко. Тепер творці можуть легко створювати дитячі книги з однаковим візуальним стилем або маркетингові матеріали бренду.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити