Kual 19 апр в 07:01

Gemini 2.5 Pro возглавил все ИИ-бенчмарки: Google возвращает корону технологического лидера

Простой

6 мин

20K

Искусственный интеллектIT-инфраструктура * Исследования и прогнозы в IT * Управление продуктом * Поисковые технологии *

Обзор

Перевод

Автор оригинала: Alberto Romero

Всем привет!
Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь полезными материалами, которые считаю стоят внимания. В основном про AI, изменение процессов, тренды и продуктовое видение.

У себя в телеграм-канале делюсь сжатыми и структурированными саммери статей.

Сегодняшний перевод — Google Is Winning on Every AI Front

Google вернулся в гонку ИИ с триумфом: их Gemini 2.5 Pro возглавил все авторитетные рейтинги моделей и получил восторженные отзывы экспертов. Компания интегрирует лучший в мире ИИ в свои сервисы с миллиардной аудиторией, создавая преимущество, которое нельзя купить за деньги — экосистему, где искусственный интеллект становится неотъемлемой частью повседневных инструментов.

Google создал не только лучшую модель, но и собственную цепочку поставок для ИИ-инфраструктуры: от TPU Ironwood до облачных сервисов. Эта вертикальная интеграция — тот же подход, который сделал Apple неуязвимой на рынке смартфонов (аппаратные спецификации TPU).

Gemini 2.5 Pro Experimental — лучшая модель в мире. Номер один в LMArena, GPQA Diamond, Humanity's Last Exam и AIME (математическое соревнование). Это также лучший результат в частных бенчмарках, таких как Aider Polyglot (код), Live Bench (разнообразие). Она лучше Claude Sonnet в игре в Pokemon (многообещающая агентная площадка) и быстро поднимается в Minecraft Bench (некоторые примеры). Она достаточно хороша в креативном письме (например, понимании длинного контекста), что было неуловимой вехой годами.

Источник — Artificial Analysis Intelligence Index

Возможно, самое важное, что результаты бенчмарков соответствуют сигналу, который я получаю из проверок по ощущениям, тестеров с хорошим вкусом и свидетельств из первых рук: люди массово сообщают о том, что Gemini 2.5 Pro действительно является лучшей моделью на сегодняшний день моделью. Редкое зрелище. (Посмотрите клип Matthew Berman)
И это только чистая производительность. Добавьте к вышесказанному, что Gemini 2.5, по сравнению с моделями своей категории, быстрый и дешевый — я имею в виду, что они предоставляют бесплатный доступ! — имеет огромное контекстное окно в 1 миллион токенов (только недавно превзойденный Meta's Llama 4) и связан со всем набором продуктов Google.

Gemini 2.5 Flash (скоро запускается) — младший брат Gemini 2.5 Pro. Он так же удивителен, но по другой причине. Вместе со старыми версиями Flash (2.0, Lite, Thinking), он будет чрезвычайно быстрым и чрезвычайно дешевым (гораздо дешевле, чем сопоставимые модели конкурентов, даже DeepSeek's, известного своей дешевизной). Они также маленькие, что делает их идеальными для граничных приложений и интеграции с телефонами.

Затем есть Gemma 3 — модель Google с открытым исходным кодом, конкурентоспособная с лучшими моделями с открытым исходным кодом, включая Llama 4 (слишком большую) и DeepSeek-V3.
Swyx построил график, показывающий, что "Google владеет Парето-фронтиром" с Gemini 2.0/2.5 (как Pro, так и Flash) по двум наиболее важным показателям: производительность и стоимость. Более того, наиболее производительные модели Google остаются экономически эффективными, а наиболее экономичные модели остаются производительными. Google на данный момент просто издевается над конкуренцией; Gemini буквально вне графиков.

LLM, лежащие в основе чатботов, таких как Gemini и ChatGPT, является главным преимуществом, но далеко не единственным. Google доминирует в других областях генеративного AI так же явно, как и в моделях на основе текста. Они объявили, что интегрируют другие AI-инструменты, которые у них есть, в Vertex AI: Lyria (музыка), Imagen 3 (изображения), Veo 2 (видео), и Chirp 3 (голос/речь). Это, в некотором роде, побочные проекты для Google. Тем не менее, они мирового класса в своих категориях. Возможно, генерация изображений ChatGPT лучше, но, например, Veo 2 заставил меня написать статью под названием "Вы должны увидеть, как далеко продвинулось AI-видео", в то время как OpenAI Sora - это чистая ерунда.
А что насчет агентов? Gemini 2.5 Pro в режиме Deep Research в два раза лучше, чем Deep Research от OpenAI (до сих пор широко считавшийся самым важным AI-продуктом для исследовательской работы). Google DeepMind продолжает развивать Project Astra (ассистент) и Project Mariner (взаимодействие с компьютером).

Если этого было недостаточно, они создали протокол Agent2Agent, дополняющий и совместимый с Model Context Protocol, который они также будут строить после выслушивания отзывов сообщества.

Недавно писал Почему A2A может вытеснить MCP в мире AI-агентов?

Вдобавок ко всему, они продолжают выпускать высококачественные статьи для публикации в Nature или представления на ICLR или NeurIPS или в других мировых журналах или конференциях. И если вдруг этого не происходит, вы в любом случае можете сказать, что они серьезно относятся как к усилиям по AGI, так и к промышленному AI.

Это всё? Не совсем. Давайте не будем забывать, что Google — компания по производству потребительского программного обеспечения в той же степени, что и AI-компания. Они создают лучшие модели, чем OpenAI и Anthropic, но они также делают много других вещей, которые никто другой делать не может.

OpenAI пытается войти на рынки, где Google уже король. Возьмем поиск (одну из самых важных категорий программного обеспечения). Google и YouTube (№1 и №2 по общему поисковому трафику, оба под зонтиком Alphabet) получают комбинированную долю 50% от общего трафика в мире (на рабочих столах). ChatGPT находится (похвально, хотя) на 6-м месте с 2,33%. Разве "ChatGPT не убил Google" 2 года назад? Сэм Альтман знает, что он пытается победить окончательного босса. (Кроме того, если у кого-то и есть массив данных, то это Google: YouTube, Search, Books, Photos и т.д.).

Но поиск — это лишь один из семи продуктов Google с не менее чем двумя миллиардами активных пользователей в месяц (Search, YouTube, Android, Maps, Chrome, Gmail и Play Store). Я хвалю OpenAI за то, что они довели ChatGPT до 500 миллионов активных пользователей в неделю (опять же, похвально), но они играют в разных лигах. Что происходит, когда Google добавляет Gemini к своему всему набору продуктов? Внезапно миллиарды людей получают доступ по умолчанию к лучшему AI в мире бесплатно. И это не говоря уже о также чрезвычайно популярных облачных сервисах Workspace (Drive, Gmail, Docs, Sheets…).
Говоря об облачных вычислениях. Google, помимо того, что является AI-компанией и программной компанией, является гиперскейлером: Google Cloud арендует чипы таким компаниям, как Anthropic, и сотрудничает с компаниями, такими как Nvidia. OpenAI, между тем, зависит от Microsoft Azure, а Anthropic также зависит от Amazon AWS. В то время как они оба щекочут ноги Google своими релизами AI, Google правой рукой борется с настоящими гигантами — Microsoft и Amazon — в облачном пространстве.

Инфографика: Amazon и Microsoft лидируют на глобальном облачном рынке | Statista

А левая рука? Подождите: AI, программное обеспечение, облако... Я что-то забываю. О, конечно, Google также является аппаратной компанией. Левой рукой Google борется с Nvidia на рынке AI-чипов (как для устранения своей бывшей зависимости от GPU, так и для продажи своих чипов другим компаниям). Насколько хорошо у них дела? Они только что анонсировали 7-ю версию своего TPU, Ironwood. Характеристики впечатляют. Это чип, созданный для эпохи AI-инференса, как и Nvidia Blackwell. Но Nvidia занята борьбой с маленькими стартапами, которые стремятся захватить долю рынка на стороне инференса для AI-рабочих нагрузок, в то время как доходы Google защищены в других местах. А OpenAI... ну.

Наконец — потому что, как бы странно это ни звучало, есть "наконец" — Google является телефонной компанией. Да, каким-то образом — уже без конечностей — она "сражается" с Apple и Samsung. И у них все довольно хорошо. Gemini уже на Pixel 9 (и, вероятно, на всех будущих телефонах, которые они создадут). Например, вы можете поделиться с ним экраном или попросить его взять на себя управление вашей камерой. Между тем, Apple все еще решает, является ли AI вапорвейром или нет, а OpenAI выясняет, откажутся ли люди добровольно от идеи телефонов. Другие пытались безуспешно.

Я наверняка что-то упускаю, но думаю, что это достаточно побед для Google.

Когда я складываю картину Google + DeepMind вместе, я могу только удивляться, почему люди, включая меня, когда-либо стали такими оптимистичными относительно OpenAI или Anthropic или даже Meta.

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.

Google выиграет в гонке ИИ?

55.91%Да52

34.41%Нет32

9.68%Свой вариант (в комментариях)9

Проголосовали 93 пользователя. Воздержались 13 пользователей.

Хабы:

Gemini 2.5 Pro возглавил все ИИ-бенчмарки: Google возвращает корону технологического лидера

Публикации

Ближайшие события