OpenAI інтегрувала генерацію зображень у ChatGPT

У чат-боті ChatGPT з’явилася нова функція — Images in ChatGPT, що дозволяє створювати та редагувати зображення прямо в чаті за допомогою моделі GPT-4o.

Про це повідомляє TechCrunch.

Це перше масштабне оновлення функціоналу візуальної генерації від компанії OpenAI за останній рік, про яке оголосив Сэм Альтман під час трансляції.

Що вміє нова система?

GPT-4o тепер генерує зображення, зокрема фото, редагує вже наявні (включно з обличчями), додає нові об’єкти до фону чи переднього плану. Хоча на створення зображення вона витрачає більше часу, ніж DALL-E 3, OpenAI підкреслює, що результат більш точний і деталізований.

Функція вже доступна для підписників Pro-плану (200 дол/міс), а незабаром її отримає і безкоштовна версія, а також користувачі ChatGPT Plus, Team і розробники через API. Ліміти для безкоштовного плану співставні з тими, що були для DALL-E (до 3 зображень на день).

Технічні покращення GPT-4o

GPT-4o демонструє кращу точність у “зв’язуванні” атрибутів до об’єктів — наприклад, на відміну від інших моделей, здатен чітко відтворити до 20 елементів у правильних кольорах та формах без помилок. Також суттєво покращено генерацію тексту на зображеннях — тепер написане рідше спотворюється, навіть у коміксах, діаграмах чи інформаційних постерах.

OpenAI замість дифузійного підходу використовує авторегресивну генерацію (зображення створюється послідовно зверху вниз і зліва направо), що, ймовірно, і забезпечує точніше відтворення тексту.

Навчання та етика

GPT-4o навчена на відкритих даних і матеріалах, наданих партнерами, такими як Shutterstock. OpenAI стверджує, що не імітує стиль живих художників і дозволяє авторам вимагати виключення своїх робіт із навчальних наборів. Також компанія поважає заборони на збирання контенту з вебсайтів.

Захист від зловживань

У відповідь на запити про захист від дипфейків і зловживань, OpenAI повідомила, що інструмент не дозволяє створювати CSAM, сексуалізовані зображення відомих осіб, не видаляє водяні знаки та блокує небезпечні запити. Замість візуальних позначок у зображення вбудовуються метадані C2PA, які свідчать про їхнє походження з OpenAI.

Зображення, створені в ChatGPT, належать користувачеві — він може використовувати їх вільно, згідно з умовами платформи.

Читайте далі

Як штучний інтелект трансформує український бізнес у 2026 році

У 2026 році штучний інтелект остаточно перейшов зі статусу...

Тенденції розвитку українського IT-аутсорсингу на тлі глобальних змін ринку

Українська індустрія IT-аутсорсингу продовжує адаптуватися до трансформацій світового технологічного...

У чіпах Apple знайшли вразливість, яка небезпечна для старих iPhone

У процесорах Apple для iPhone виявили вразливість, яка зачіпає низку старіших пристроїв і може бути використана для обходу систем захисту.

OpenAI запускає програму для виправлення вразливостей у відкритому коді

Компанія OpenAI запускає програму, яка допоможе розробникам відкритого ПЗ швидше знаходити та виправляти помилки безпеки.

Imec показала нові рішення для пам’яті ШІ

Бельгійський дослідницький центр Imec представив дві нові розробки у сфері пам’яті для комп’ютерів та систем штучного інтелекту.