Компанія OpenAI оголосила про запуск нової базової моделі штучного інтелекту GPT-5.4. За словами розробників, це найефективніша передова модель компанії для професійних завдань.
Разом зі стандартною версією також представили дві модифікації: GPT-5.4 Thinking, орієнтовану на складні задачі з міркуванням, та GPT-5.4 Pro, оптимізовану для максимальної продуктивності.
Що відомо про нову модель ШІ
У версії API модель отримала контекстне вікно до 1 мільйона токенів – найбільше серед моделей штучного інтелекту OpenAI. Компанія також заявляє про підвищену ефективність використання токенів. Так, GPT-5.4 здатна виконувати ті самі завдання, що й GPT-5.2, використовуючи менше обчислювальних ресурсів.
Модель показала покращені результати у кількох тестах. Вона отримала рекордні бали в тестах використання комп’ютера OSWorld-Verified та WebArena Verified. І також набрала 83% у внутрішньому тесті OpenAI GDPval, який оцінює виконання інтелектуальних робочих завдань.
У бенчмарку Mercor APEX-Agents, що перевіряє професійні навички у сферах права та фінансів, GPT-5.4 також посіла перше місце. Генеральний директор Mercor Брендон Фудді заявив, що модель добре справляється зі створенням довгих результатів — презентацій, фінансових моделей і юридичного аналізу.
OpenAI також повідомила про зменшення кількості помилок. Порівняно з GPT-5.2 нова модель на 33% рідше допускає неточності в окремих твердженнях, а загальні відповіді на 18% рідше містять фактичні помилки.
Також OpenAI провела нову перевірку безпеки для моделей міркування. За результатами тестування, версія GPT-5.4 Thinking рідше демонструє ознаки спотворення процесу міркування, що підтверджує ефективність моніторингу ланцюжка думок як інструменту безпеки.
