OpenAI представила GPT-5.2-Codex — новую модель для агентного программирования, оптимизированную для сложной работы в реальных репозиториях и длительных сессиях. Компания позиционирует ее как самую продвинутую в линейке Codex. GPT-5.2-Codex уже доступна платным пользователям ChatGPT в интерфейсе Codex. Доступ через API обещают открыть в ближайшие недели.

Главный фокус обновления — длинные задачи. Модель получила "уплотнение контекста" (context compaction), более надежный вызов инструментов и улучшенную фактологическую точность. По заявлению OpenAI, GPT-5.2-Codex лучше справляется с крупными изменениями кода: рефакторингами, миграциями и сборкой новых фич. Отдельно улучшили работу в Windows-окружениях.
OpenAI заявляет о лучших результатах на бенчмарках SWE-Bench Pro (56,4%) и Terminal-Bench 2.0 (64,0%) — это тесты, где модель должна решать задачи в реальных репозиториях и терминальных средах. Разрыв с предыдущими версиями небольшой, но стабильный.
OpenAI отдельно подчеркивает прогресс Codex в задачах по кибербезопасности. В качестве наглядного примера компания приводит результаты на профессиональных заданиях формата Capture-the-Flag (CTF) — это практические "боевые" задачи, где нужно находить уязвимости и добывать "флаг" (секретную строку), подтверждающую успешную атаку. На графике ниже видно, как за 2025 год росла точность линейки: от ранних версий до GPT-5.2 и GPT-5.2-Codex.

Практическую пользу линейки Codex демонстрирует недавний кейс: исследователь безопасности Эндрю Макферсон с помощью предыдущей модели (GPT-5.1-Codex-Max) за неделю нашел несколько уязвимостей в React Server Components — и ответственно сообщил о них команде React. OpenAI рассчитывает, что новая версия будет ещё эффективнее в подобных задачах.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
