
OpenAI 7 мая выпустил расширение Codex для Chrome — агент получает прямой доступ к залогиненным сессиям пользователя на любых сайтах: от Gmail и LinkedIn до Salesforce и корпоративных панелей. Поводом для расширения функциональности компания называет внутреннюю статистику: Codex используют 4 млн человек в неделю, аудитория выросла в 8 раз с начала года.
Главная инженерная особенность — отказ от петли "скриншот → рассуждение → клик", которую используют классические агентские системы для управления компьютером (computer use). Раньше Codex тоже мог работать в браузере, но обращался с ним как с любым десктопным приложением: делал скриншот окна, анализировал картинку, двигал курсор и ждал результата. В демо-ролике руководитель направления по работе с разработчиками в OpenAI Доминик Кундель объяснил, что новое расширение встраивается прямо в Chrome через стандартный механизм расширений и видит структуру страниц нативно — со всеми вкладками, куки и сессиями. Это позволяет агенту работать параллельно в нескольких вкладках и держать между ними контекст.
В результате Codex получает доступ к рабочим сайтам без переавторизации — Salesforce, Jira, внутренние дашборды и любые корпоративные веб-приложения. Агент может ходить по нескольким открытым вкладкам и собирать из них контекст: например, перенести данные звонка в CRM или подготовить отчет из нескольких источников. Поддерживается работа со встроенными инструментами разработчика Chrome (DevTools) для тестирования веб-приложений. Codex запускается в отдельной группе вкладок, чтобы не занимать активную работу пользователя.
По умолчанию агент спрашивает разрешение перед заходом на каждый новый сайт. Пользователь может разрешить один сеанс, добавить сайт в постоянный белый список или отказать; отдельный список доменов под запретом тоже настраивается. Доступ к истории браузера, скачиваниям и загрузкам требует ручного подтверждения каждый раз. OpenAI отдельно предупреждает о риске prompt injection — вредоносных инструкций, спрятанных в содержимом сайта, которые теоретически могут перехватить контроль над агентом. Записи действий в браузере компания сохраняет только в том объеме, в котором они попадают в контекст текущего диалога: скриншоты, тексты, выводы инструментов.
Запуск встраивается в более крупный план OpenAI собрать ChatGPT, Codex и собственный браузер Atlas в один клиент. Расширение для Chrome здесь работает как промежуточная ступень: пока полноценного объединения нет, пользователи получают агента, который умеет жить в их основном браузере. Конкуренция в этом сегменте плотная — у Anthropic уже есть Claude in Chrome, у Cursor — собственная агентская среда. Codex для Chrome работает на Windows и macOS, поддержки других Chromium-браузеров пока нет.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
