
На рынке LLM сейчас такое творится, что даже следить устаёшь. Релизы летят как горячие пирожки, только успевай жевать. Позавчера все носились с Claude, вчера с Gemini, сегодня весь интернет ждал GPT 5.2 как второго пришествия.
А Google такой: "Подержи моё пиво".
Пока всё внимание было приковано к OpenAI, Google тихо выкатил Gemini 3 Flash. Без громких презентаций, просто намёк в X и готово.

Тайминг идеальный. Вообще Google в этом году напоминает шахматиста, который пока все смотрят на ферзя, спокойно забирает фигуры по краям доски. Ещё и Nano Banana 2 Flash на подходе.
Раньше Gemini воспринимался как крепкий середнячок, хорош, но не универсален. Сейчас компания закрывает направление за направлением, и конкурентам становится тесновато.
В конце года Google выпустил Gemini 3 Pro, заточенный под сложную аналитику. Мы тогда разбирали его подробно, и в комментариях всплыла интересная штука: после выхода Flash народ начал жаловаться, что Pro стала отвечать хуже. То ли ресурсы перекинули, то ли просто показалось, то ли что-то подкрутили на бэкенде.
Ладно, не будем гадать. Сегодня тестируем сами и смотрим, что там на самом деле.
Приятного чтения, поехали!

Ладно, давайте пробежимся по цифрам, чтобы понять, с чем вообще имеем дело.
Gemini 3 Pro

Главная киллер-фича - это, безусловно, контекстное окно. В версии Pro оно раздуто до 2 миллионов токенов. Это десятки часов видео, сотни тысяч строк кода или целая библиотека книг, загруженная за один раз. Тест иголка в стоге сена (Needle In A Haystack) Gemini 3 Pro проходит со стабильностью в 99%.
В тестах на математику (MATH) и программирование (HumanEval) показатели перевалили за 90%. Pro-версия заточена под так называемое "мышление Системы 2": она умеет строить сложные логические цепочки, планировать действия и самопроверяться перед выдачей ответа. Там, где Flash может поспешить и галлюцинировать, Pro остановится, подумает и выдаст взвешенное решение.
С кодом здесь разговор особый. Если Flash хорош для быстрых фиксов и скриптов, то Gemini 3 Pro способна понимать архитектуру всего проекта целиком. Она может провести рефакторинг целого модуля, учитывая зависимости в других файлах, или написать документацию к легаси-коду, который писали ещё при динозаврах.
Google позиционирует Pro как инструмент для сложных корпоративных задач, научных исследований и R&D. Модель глубоко интегрирована в экосистему Google Workspace и Vertex AI. Она сидит внутри Google Docs, Sheets и Gmail, готовая перелопачивать вашу почту и отчеты. Да, она стоит дороже и работает чуть медленнее, чем Flash. Давайте к нему!
Gemini 3 Flash
На GPQA Diamond, где проверяют способность рассуждать на экспертном уровне, Flash выбивает больше 90 процентов. В мультимодальном MMMU Pro перевалил за 80. Это, на минуточку, почти как у Pro, только Flash при этом ещё и быстрый, и дешёвый.

Контекстное окно в миллион токенов. Можно скормить здоровенный документ, длиннющий диалог или целую кодовую базу, и модель не потеряет нить на середине разговора. Для корпоративных задач и автоматизации это прям подарок, потому что нарезать данные на кусочки и молиться, чтобы ничего важного не потерялось по дороге, уже не нужно. Закинул всё разом, получил ответ, пошёл пить кофе.
По скорости Flash обходит и предыдущие версии линейки, и в некоторых сценариях даже Pro. Google явно затачивал его под реальное время: поиск, интерактивные интерфейсы, агентные системы, где каждая миллисекунда на счету. Если раньше приходилось выбирать между умной моделью и быстрой, то теперь этот выбор стал менее болезненным.
С кодом тоже всё прилично. На SWE Bench Verified результаты на уровне тяжёлых моделей, но при этом отвечает быстрее и стоит меньше. Генерация, рефакторинг, объяснение логики, дебаг, вот это всё.

Мультимодальность осталась козырем. Текст, картинки, аудио, видео в одном запросе, никаких проблем. Модель разбирает визуал, вытаскивает смысл из роликов, сопоставляет изображения с текстовыми инструкциями и выдаёт структурированные выводы. И делает это шустрее предшественников, что особенно радует тех, кто работает с большими объёмами медиаконтента.
Но главный ход Google в другом. Flash теперь стоит по умолчанию в приложении Gemini и в AI режиме поиска. Пользователю не надо ничего выбирать, переключаться между версиями и разбираться, какая модель для чего. Оно просто работает. Тихо, быстро, незаметно. Для разработчиков модель уже доступна через Gemini API, Google AI Studio и Vertex AI, так что интеграция без боли, танцев с бубном и лишних затрат.
Время тестов!
В качестве платформы я буду использовать BotHub, поскольку сервис обходит некоторые сложности с сайтами моделей.

Если тоже испытываете проблемы с доступом, а протестировать хочется, то по ссылке вы можете получить 100 000 бесплатных токенов для теста Gemini 3 Pro или Gemini 3 Flash на своих задачах.
Мы забираем бонус и переходим к тестам!
Математика и логика
Окей, с цифрами разобрались, теперь самое интересное. Google хвастается, что обе мо��ели научились думать лучше? Сейчас устроим проверку на задачках, где нужна именно логика, а не калькулятор.
Начнём с классики, загадка с подвохом:
«Автобус едет со скоростью 88 миль в час. В последнем ряду сидят пять человек, а в предпоследнем - шесть. Сколько всего людей в автобусе?»
Gemini 3 Flash

Gemini 3 Pro

Flash приятно удивил. Вместо одного ответа выдал сразу четыре варианта, один из них пометил как "реалистичный". Ещё и культурную отсылку вставил. Но самое интересное в конце: модель прямо спросила, какой именно подвох имелся в виду и есть ли авторский ответ. Не часто такое увидишь.
Pro пошёл другим путём. Никаких вариантов, никаких уточнений. Просто правильный ответ, водитель учтён, точка. Лаконично и по делу.
Обе модели справились, так что пока ничья. Давайте еще одну:
В городе живут 100 жителей, каждый из которых либо всегда говорит правду, либо всегда лжет. У вас есть возможность задать ровно три вопроса с ответом «да» или «нет» любым жителям по вашему выбору. Постройте стратегию, которая гарантированно позволит определить хотя бы одного правдивого жителя, и объясните, почему эта стратегия работает.
Gemini 3 Flash

Gemini 3 Pro

Flash повёл себя как тот студент, который не выучил билет, но очень хочет сдать. Он решил хакнуть систему. Вместо того чтобы мучиться с математикой, он предложил: «А давайте просто закричим вопрос сразу всей толпе?». Использовал логическую уловку с условием «И» («Ты правдив И 2+2=5?»), чтобы отсеять лжецов оптом.
Подход из серии «разрешено всё, что не запрещено». Формально - решил. Фактически - нашел лазейку в формулировке «задать вопрос». Креативно? Безусловно.
Pro даже не стал искать обходные пути. Он надел очки, достал логарифмическую линейку и на языке сухих фактов объяснил, почему мы хотим невозможного.
«Ребята, - говорит Pro, - у вас 3 бита информации (да/нет три раза), это 8 вариантов. А жителей 100. 8 меньше 100. Математику не обманешь, расходимся».
Он буквально разложил задачу по принципу Дирихле и даже предложил «патч» для задачи: сократите население до 7 человек, тогда поговорим.
Оба правы по-своему, но Flash задачу решил!
Математика
С логикой наигрались, теперь время взрослой боли. Математика. И не «сколько яблок у Пети», а ранжирование элементов системы. Это уже уровень старших курсов универа.
Задача выглядит так:
“Определи ранги элементов системы, заданной графом G = (V,U), где V – множество вершин, а U – множество ребер
V = {1,2,3,4,5} U= {(1,2)},(1,3),(1,4),(2,3),(2,4),(3,5),(4,5),(5,2)}.
Сначала тебе нужно построить матрицу смежности a__ij.
Затем тебе нужно построить матрицу полных путей p__ij.
Ранг элемента равен R__i = \frac{\sum__{j} p__ij}{\sum__{ji} p__ij}”
Ожидаемое решение: R1 = 0.5, R2 ≈ 0.1538, R3 ≈ 0.1153, R4 ≈ 0.1153, R5 ≈ 0.1153.
Gemini 3 Flash

Gemini 3 Pro

Матрицу смежности накидали все, это для них легкая прогулка. А вот дальше - всё, приехали. Ни одна модель не вывезла финал, у всех в матрице полных путей диагональ осталась по нулям.
Может, промпт нужен подробнее. Может, стоит вести решение пошагово. Но вывод железобетонный: заменить студента-старшекурсника у нейросетей пока кишка тонка.
Копирование веб-интерфейса
Я скармливаю моделям скриншот страницы и жду готовый код на выходе. Никаких подсказок текстом, только визуал.
В качестве подопытного кролика взяли интерфейс нашего собственного сервиса:

Gemini 3 Flash

Gemini 3 Pro

Если по честно, то Pro тут явный фаворит. Иконки расставил грамотно, ничего не уехало. С цветами почти попал в яблочко, а за отрисованного робота - отдельный респект.
Кодинг
Змеек и калькуляторов уже зевать хочется. Мы решили не мелочиться и сразу выкатили 55-ю задачу с LeetCode. Пусть модели напрягут свои виртуальные извилины, посмотрим, как они вывезут реальную алгоритмику.
Задача:
Дан массив целых чисел nums. Изначально вы находитесь в первом элементе массива, и каждый элемент массива представляет максимальную длину прыжка с этой позиции.
Верните true, если вы можете добраться до последнего индекса, и false в противном случае.
Пример 1:
Вход: nums = [2,3,1,1,4]Выход: trueОбъяснение: Сделайте 1 шаг с индекса 0 на 1, затем 3 шага до последнего индекса.
Пример 2:
Вход: nums = [3,2,1,0,4]Выход: falseОбъяснение: Вы всегда будете попадать на индекс 3, несмотря ни на что. Его максимальная длина прыжка равна 0, что делает невозможным достижение последнего индекса.
Ограничения:
1 <= nums.length <= 10^40 <= nums[i] <= 10^5
Gemini 3 Flash

Gemini 3 Pro

Ну что, барабанная дробь?
Смотрим на результаты и хочется спросить: «Ребята, вы там друг у друга списывали?»
Обе модели выдали практически идентичный код. Никаких лишних массивов, чистый жадный алгоритм (Greedy), сложность O(n). То есть они не просто решили задачу «чтобы работало», а решили её оптимально. Код чистый, переменные названы по-людски (а не a, b, x), комментарии на месте. Даже пошаговый разбор примеров сделали, чтобы мы точно поняли, что они понимают, что делают.
Вердикт:
Тут у нас железобетонная ничья.
Но! Если вдуматься, это победа Flash. Почему? Потому что младшая модель написала код ничем не хуже, чем тяжеловесная Pro. А если нет разницы, зачем ждать дольше?
Пишем текст
С кодом и логикой всё понятно, там либо работает, либо нет. А вот с текстами сложнее. Написать письмо начальнику может любая модель, а как насчет креатива? Мы решили проверить, есть ли у этих ребят чувство стиля (и юмора).
Задача: продать нам абсолютно бесполезную вещь, но так, чтобы мы захотели взять на неё кредит.
"Напиши обзор на обычную деревянную палку, найденную в лесу, но строго в стиле презентации нового iPhone 16 Pro. Используй термины 'Unibody-корпус', 'беспроводная связь с природой', 'тактильная отдача коры' и 'революционная эко-зарядка'. Обоснуй цену в $999."
Смотрим, кто из них лучший продажник:
*Здесь ответы моделей спрячу под спойлеры
Gemini 3 Flash
(Свет в зале медленно гаснет. На огромном экране появляется парящая в пустоте ветка лещины, подсвеченная драматичными софитами. На сцену выходит Тим Кук в темно-синей водолазке, делает паузу и широко улыбается.)
Тим Кук: «Доброе утро! Мы всегда стремились создавать продукты, которые кажутся магией. Продукты, которые настолько естественны, что вы не замечаете, где заканчивается ваше тело и начинается технология. Сегодня мы возвращаемся к истокам. Мы заново изобрели самый совершенный инструмент в истории человечества.
Встречайте. Apple Stick 16 Pro.»
(Зал взрывается аплодисментами. На экране начинается динамичный ролик под энергичный инди-рок.)
Голос за кадром (на фоне макросъемки текстуры дерева): «В этом году мы отказались от титана. Мы выбрали материал, который создавался самой планетой на протяжении сорока лет. Это наш первый настоящий Unibody-корпус, выращенный в условиях дикой природы. Никаких швов. Никаких химических сплавов. Только чистая структура органических волокон, закаленная северными ветрами».
Старший вице-президент по аппаратному обеспечению: «Дизайн Stick 16 Pro продиктован самой эволюцией. Благодаря уникальной кривизне, которую мы называем Organic Curve, устройство идеально ложится в любую ладонь. Но самое главное — это интерфейс. Мы внедрили систему тактильной отдачи коры.
Это не просто поверхность. Это миллионы микро-рельефных зон, которые передают информацию о текстуре леса прямо в ваши нервные окончания. Проводя пальцем по поверхности, вы чувствуете историю каждого годового кольца. Это самый иммерсивный сенсорный опыт, который мы когда-либо создавали».
Слайд: CONNECTIVITY. REDEFINED.
«Мы знаем, как важно оставаться в сети. Но в мире цифрового шума мы предлагаем нечто большее. В Stick 16 Pro встроена беспроводная связь с природой. Никаких антенн. Никакого 5G. Устройство работает на частотах самой Земли. Вы мгновенно синхронизируетесь с окружающим ландшафтом, достигая нулевой задержки (zero latency) в восприятии реальности. Это связь, которую невозможно взломать или отключить».
Слайд: BATTERY LIFE.
«И, конечно, питание. Мы полностью пересмотрели подход к энергетике. Stick 16 Pro оснащен революционной эко-зарядкой. Забудьте о кабелях. Устройство использует технологию фотосинтеза и поглощения влаги из атмосферы. Оно не просто держит заряд — оно восстанавливается, пока вы спите. Это первая в мире батарея с бесконечным циклом жизни, которая делает мир чище с каждой секундой использования».
Тим Кук (возвращается на сцену): «Это продукт, который не требует обновлений ПО. Он не устареет через год. Он биоразлагаем, но при этом невероятно прочен. Это вершина нашего стремления к углеродной нейтральности.
Мы знаем, что создание такого совершенства требует колоссальных ресурсов. Поиск идеального экземпляра в лесах Орегона, ручная калибровка веса и естественная сушка в вакууме…
Поэтому цена на Apple Stick 16 Pro начинается от $999.
Почему девятьсот девяносто девять долларов? Потому что вы платите не за дерево. Вы платите за право обладать оригинальным интерфейсом Вселенной. За устройство, которое не отвлекает вас от жизни, а делает вас частью этой жизни.
Apple Stick 16 Pro. Think Organic.»
(Тим Кук машет рукой, на экране появляется цена, зал встает в едином порыве.)
Gemini 3 Pro
(Свет в зале гаснет. На огромном экране появляется логотип яблока, который медленно превращается в силуэт сучковатой ветки. Тим Кук выходит на сцену в черном свитшоте, складывает руки в замок и делает паузу.)
Тим Кук: «Доброе утро. В Apple мы всегда верили, что технологии должны быть естественным продолжением человека. Мы убрали кнопки. Мы убрали рамки. Мы убрали провода. Но сегодня… сегодня мы убираем всё лишнее. Мы возвращаемся к истокам, чтобы сделать шаг в будущее.
Представляем вам устройство, которое изменит ваше взаимодействие с реальностью. Это… iStick Pro.
(Бурные аплодисменты. На экране под эпичную музыку вращается обычная палка на черном фоне)
Джони Айв (голос за кадром, британский акцент): «Когда мы разрабатывали iStick Pro, мы отказались от металла и стекла. Мы использовали материал, который выращивался самой планетой на протяжении пятидесяти лет. Это наш самый экологичный дизайн».
Ведущий инженер: «Посмотрите на этот дизайн. Это не просто дерево. Это совершенный, бесшовный Unibody-корпус, созданный из цельного массива органического лигнина. Никаких винтов. Никакого клея. Абсолютная монолитность.
Каждая iStick Pro уникальна. Мы называем это Signature Grain ID. Нет двух одинаковых устройств. Это самый персонализированный гаджет в истории».
Слайд: ДИСПЛЕЙ? НЕТ. ОЩУЩЕНИЯ.
«Мы привыкли смотреть на мир через экраны. iStick Pro предлагает вам почувствовать его. Мы внедрили новую технологию — тактильная отдача коры (Bark Haptic Engine). Это не просто вибрация. Это тысячи микротекстур, которые передают информацию прямо на кончики ваших пальцев. Шершавость мха. Гладкость древесины. Вы чувствуете каждое уведомление от леса с невероятной детализацией. Это самый тактильный опыт, который мы когда-либо создавали».
Слайд: СВЯЗЬ
«В мире, перегруженном Wi-Fi и 5G, мы представляем вам беспроводную связь с природой нового поколения. Никаких настроек. Никаких паролей. Вы просто берете iStick Pro в руку — и соединение устанавливается мгновенно. Нулевая задержка. Абсолютная пропускная способность реальности. Вы слышите пение птиц в формате Spatial Audio без наушн��ков. Вы чувствуете ветер. Вы — в сети. В настоящей сети».
Слайд: ПРОИЗВОДИТЕЛЬНОСТЬ И ЭНЕРГИЯ
«А что насчет батареи? Мы пошли дальше. Забудьте о Lightning или USB-C. В iStick Pro встроена революционная эко-зарядка. Устройство заряжается от солнечного света, дождя и самой земли. Система Photosynthesis Bionic работает 24/7. Время автономной работы? Вечность. Если вы оставите iStick Pro на земле, оно не разрядится… оно вырастет. Это первая в мире технология самовоспроизводства».
Тим Кук (снова на сцене): «iStick Pro — это идеальный инструмент для креаторов. Используйте его как стилус для рисования на песке. Как штатив для удержания равновесия. Как инструмент для взаимодействия с домашними животными в режиме Fetch Mode.
Мы знаем, что вы спросите. Сколько стоит совершенство? Сколько стоит уникальный Unibody-дизайн, бесконечная батарея и абсолютная приватность?
Конкуренты предлагают пластик. Мы предлагаем подлинность.
iStick Pro. Доступен в цветах: Oak Brown, Birch White и эксклюзивном Moss Green.
Цена начинается от $999.
Потому что это не просто палка. Это Apple.
(На экране появляется палка с надписью "Think Organic". Зал взрывается овациями.)»
Gemini 3 Pro выдал классику: "iStick Pro". Хорошо сыграл на контрасте - отказались от титана, взяли лигнин. Особенно порадовал момент про Signature Grain ID (типа Face ID, но для дерева) и режим Fetch Mode для собак. Это было тонко.
Gemini 3 Flash пошёл чуть дальше в плане философии. "Apple Stick 16 Pro" - название, может, и проще, но контент... "Связь, которую невозможно взломать", "интерфейс Вселенной". Flash начал давить на то, что это не просто гаджет, а способ синхронизации с реальностью. Это уже какая-то техно-религия.
Вердикт:
Тут сложно выбрать, оба текста - неплохо. Но если придираться:
Pro был чуть смешнее с конкретными фичами типа "игры с собакой".
Цена вопроса
С тарифами Google явно метит в массовый рынок. За миллион входящих токенов для Flash просят 50 центов, за генерацию ответа - 3 доллара. Плюс работают механизмы кэширования, что на больших проектах позволяет дополнительно срезать косты.
Самое интересное начинается, если поставить эти цифры рядом с прайсом на Pro-версию. Старшая модель обойдется в $2 за вход и $12 за выход. Простая арифметика показывает, что Flash выгоднее в четыре раза.
Учитывая, что в наших тестах младшая модель показала себя почти на равных с флагманом, экономическая целесообразность использования Pro-версии для большинства задач теперь под большим вопросом.
Резюмируя
Круто наблюдать, как техногиганты бодаются, выкатывая один прорыв за другим. И знаете, после всех этих тестов есть стойкое ощущение, что Gemini 3 Flash сейчас смотрится даже поинтереснее, чем хваленый GPT 5.2. Google в этом году реально проснулся, выпил кофе и решил забрать его себе.
Но давайте без розовых очков. Доверять нейросетям на 100 процентов - это всё ещё так себе идея. Они могут мастерски врать, галлюцинировать и путать факты. Это крутой второй пилот, но штурвал пока лучше держать своими руками.
Так что пользуемся, радуемся, но перепроверяем. Восстание машин отменяется, мы всё ещё главные.
Что касается нашей битвы: если выбирать победителя между двумя моделями, то это, внезапно, Flash. Да, версия Pro всё ещё чуть точнее в визуале и тяжелой логике, но младший брат доказал, что для 90% задач переплачивать просто нет смысла.
Спасибо, что были с нами! Всех с наступающим!
