OpenAI представила GPT-5.4: первая модель ИИ с нативным управлением компьютером

OpenAI выпустила GPT-5.4 — новую фронтирную языковую модель, которая впервые в линейке компании умеет напрямую управлять компьютером: кликать, вводить текст и навигировать по интерфейсам операционной системы, превосходя при этом среднего человека по точности выполнения задач.

Что такое GPT-5.4 и в чём её главная особенность

GPT-5.4 — это объединение возможностей логического мышления, программирования и автономных агентных процессов в одной модели. Главное нововведение — нативная функция управления компьютером (computer use): модель самостоятельно работает с программным обеспечением в цикле «планирование → выполнение → проверка → исправление», без необходимости в ручном вмешательстве пользователя.

В бенчмарке OSWorld-Verified, который оценивает навигацию по интерфейсам ОС, GPT-5.4 набрала 75% успешных выполнений — это выше среднего результата человека (72,4%) и значительно лучше прошлой версии GPT-5.2 (47,3%). При этом модель справляется с задачами за меньшее количество шагов.

Три версии модели: Thinking, Pro и API

OpenAI выпустила сразу несколько вариантов модели под разные сценарии использования:

  • GPT-5.4 Thinking — доступна подписчикам ChatGPT Plus/Team/Pro, генерирует план рассуждений перед ответом, приходит на смену GPT-5.2 Thinking.
  • GPT-5.4 Pro — самая мощная версия для сложных корпоративных задач, с поддержкой контекста до 1 миллиона токенов.
  • API и Codex — версии для разработчиков с расширенными интеграциями, в том числе с macOS Codex и Xcode.

Ключевые улучшения по сравнению с GPT-5.2

Помимо управления компьютером, GPT-5.4 получила ряд существенных улучшений:

  • Программирование: превосходит GPT-5.3-Codex по бенчмарку SWE-Bench Pro при меньшей задержке ответа.
  • Профессиональные задачи: по бенчмарку GDPval (44 профессии) модель в 83% случаев справляется на уровне профильных специалистов или лучше — против 70,9% у GPT-5.2.
  • Веб-поиск и синтез: BrowseComp — 82,7% (Pro-версия — 89,3%), тогда как GPT-5.2 показывала лишь 65,8%.
  • Мультимодальность: поддержка обработки изображений с разрешением до 10,24 мегапикселей.
  • Меньше галлюцинаций: количество фактических ошибок снизилось на 33% в утверждениях и на 18% в ответах по сравнению с GPT-5.2.

Tool Search: экономия токенов до 47%

Для повышения эффективности в GPT-5.4 реализована функция Tool Search — динамическая подгрузка описаний инструментов только в тот момент, когда они нужны. Это позволяет снизить расход токенов до 47%, что особенно важно при работе с большими кодовыми базами, длинными документами и сложными агентными цепочками.

Доступность

OpenAI уже начала распространение новых моделей: GPT-5.4 Thinking и Pro доступны в приложении и веб-версии ChatGPT для подписчиков Plus, Team и Pro, а также через API и Codex для разработчиков.

Фото аватара

Платон Щукин

SEO

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *