OpenAI выпустила GPT-5.4 — свою новую флагманскую модель / Хабр

Главное изменение: модель объединила возможности кодинга из GPT-5.3-Codex с улучшенным рассуждением из GPT-5.2. Раньше это были отдельные модели под разные задачи, теперь одна.

На бенчмарке GDPval, где модели выполняют рабочие задачи по 44 профессиям (презентации, таблицы, графики, расписания), GPT-5.4 совпала с уровнем профессионалов или превзошла их в 83% случаев. У GPT-5.2 было 70.9%.

На внутреннем тесте задач инвестиционного аналитика модель набрала 87.3% против 68.4% у предшественника. На OSWorld, где модель управляет десктопом через скриншоты и клавиатуру, результат вырос с 47.3% до 75% — это выше человеческого показателя в 72.4%.

Отдельная новинка — tool search. Раньше все определения инструментов загружались в контекст сразу, даже если модель ими не пользовалась. Это съедало тысячи токенов на каждый запрос. Теперь модель получает список доступных инструментов и подгружает нужные по мере необходимости. На тесте из 250 задач с 36 MCP-серверами это сократило расход токенов на 47% при том же качестве.

Контекстное окно — до 1 миллиона токенов.

Цена в API выросла: $2.50 за миллион входных токенов против $1.75 у GPT-5.2, выходные почти не изменились — $15 против $14.

Источник: https://openai.com/index/introducing-gpt-5-4/

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!