OpenAI выпустила GPT-5.4 — новую фронтирную языковую модель, которая впервые в линейке компании умеет напрямую управлять компьютером: кликать, вводить текст и навигировать по интерфейсам операционной системы, превосходя при этом среднего человека по точности выполнения задач.
Что такое GPT-5.4 и в чём её главная особенность
GPT-5.4 — это объединение возможностей логического мышления, программирования и автономных агентных процессов в одной модели. Главное нововведение — нативная функция управления компьютером (computer use): модель самостоятельно работает с программным обеспечением в цикле «планирование → выполнение → проверка → исправление», без необходимости в ручном вмешательстве пользователя.
В бенчмарке OSWorld-Verified, который оценивает навигацию по интерфейсам ОС, GPT-5.4 набрала 75% успешных выполнений — это выше среднего результата человека (72,4%) и значительно лучше прошлой версии GPT-5.2 (47,3%). При этом модель справляется с задачами за меньшее количество шагов.
Три версии модели: Thinking, Pro и API
OpenAI выпустила сразу несколько вариантов модели под разные сценарии использования:
- GPT-5.4 Thinking — доступна подписчикам ChatGPT Plus/Team/Pro, генерирует план рассуждений перед ответом, приходит на смену GPT-5.2 Thinking.
- GPT-5.4 Pro — самая мощная версия для сложных корпоративных задач, с поддержкой контекста до 1 миллиона токенов.
- API и Codex — версии для разработчиков с расширенными интеграциями, в том числе с macOS Codex и Xcode.
Ключевые улучшения по сравнению с GPT-5.2
Помимо управления компьютером, GPT-5.4 получила ряд существенных улучшений:
- Программирование: превосходит GPT-5.3-Codex по бенчмарку SWE-Bench Pro при меньшей задержке ответа.
- Профессиональные задачи: по бенчмарку GDPval (44 профессии) модель в 83% случаев справляется на уровне профильных специалистов или лучше — против 70,9% у GPT-5.2.
- Веб-поиск и синтез: BrowseComp — 82,7% (Pro-версия — 89,3%), тогда как GPT-5.2 показывала лишь 65,8%.
- Мультимодальность: поддержка обработки изображений с разрешением до 10,24 мегапикселей.
- Меньше галлюцинаций: количество фактических ошибок снизилось на 33% в утверждениях и на 18% в ответах по сравнению с GPT-5.2.
Tool Search: экономия токенов до 47%
Для повышения эффективности в GPT-5.4 реализована функция Tool Search — динамическая подгрузка описаний инструментов только в тот момент, когда они нужны. Это позволяет снизить расход токенов до 47%, что особенно важно при работе с большими кодовыми базами, длинными документами и сложными агентными цепочками.
Доступность
OpenAI уже начала распространение новых моделей: GPT-5.4 Thinking и Pro доступны в приложении и веб-версии ChatGPT для подписчиков Plus, Team и Pro, а также через API и Codex для разработчиков.