Самая дорогая модель искусственного интеллекта от Google, похоже, преодолела важный рубеж: она победила в видеоигре 29-летней давности. Вчера вечером генеральный директор Google Сундар Пичаи с триумфом опубликовал на X: «Какой финиш! Gemini 2.5 Pro только что прошел Pokémon Blue!»

Для ясности: прямая трансляция Gemini Plays Pokemon была создана «30-летним инженером-программистом, не связанным с Google», которого зовут Джоэл Зи. Но руководители Google приветствуют это начинание.
Например, Логан Килпатрик, руководитель отдела разработки Google AI Studio, в прошлом месяце написал, что Gemini «добилась большого прогресса в прохождении Pokémon» и заработала свой пятый значок (следующая лучшая модель пока имеет только 3), что заставило Пичаи пошутить: «Мы работаем над API, искусственным интеллектом покемонов»
Почему Pokémon? Еще в феврале Anthropic подчеркнула прогресс, которого достигли ее модели искусственного интеллекта Claude в «Pokémon Red», написав, что «расширенное мышление и обучение агентов» Claude дают ему «значительный толчок» для «более неожиданных» задач, таких как прохождение игры. («Pokémon Red» и «Blue» — это разные версии игры GameBoy, впервые выпущенной в 1996 году и связанной с давней франшизой Pokémon). Есть даже канал Claude Plays Pokemon на Twitch, который Джоэл Зи назвал источником вдохновения.
Несмотря на прогресс, Claude, похоже, пока не победил «Pokémon Red». Означает ли это, что Gemini объективно лучше в этой игре? На своей странице Twitch Джоэл Зи призвал зрителей: «Пожалуйста, не считайте это эталоном того, насколько хорошо LLM может играть в Pokemon. Вы не можете делать прямых сравнений — у Gemini и Claude разные инструменты, и они получают разную информацию».
Обеим моделям AI нужна помощь в игре — вот тут-то и вступают в дело вышеупомянутые агентские упряжки, предоставляя моделям игровые скриншоты с наложенной на них дополнительной информацией, позволяя модели решать, как реагировать (что может включать вызов специализированных агентов), а затем нажимать кнопку, соответствующую инструкции AI.