Последняя предварительная версия языковой модели Google Gemini 2.5 Pro содержит значительные улучшения для разработки внешнего интерфейса и сложных задач программирования.

Компания Google выпустила обновлённую предварительную версию своей модели искусственного интеллекта Gemini 2.5 Pro под названием «I/O Edition». Эта версия предназначена для разработчиков, заинтересованных в тестировании модели перед предстоящей конференцией Google I/O. Обновлённая версия разработана с целью оптимизации работы при выполнении стандартных задач в области программирования и содействия в создании рабочих процессов с использованием агентов.

По словам Google, Gemini 2.5 Pro в настоящее время является лучшим в рейтинге WebDev Arena — бенчмарке, в котором люди-рецензенты оценивают внешний вид и функциональность веб-приложений, хотя сам рейтинг несколько спорный. Такие стартапы, как Cognition и Replit, уже используют обновлённую модель для создания агентов кода, которые могут самостоятельно генерировать приложения.
Одной из новых функций является анализ видеоконтента. Gemini 2.5 Pro набирает 84,8 процента баллов в тесте VideoMME и может генерировать приложения непосредственно на основе видео. Модель также может создавать визуализации на основе кода из изображений, вот пример в приложении Gemini.
Ещё одна демонстрация, «Видео для обучающего приложения», превращает одно видео с YouTube в интерактивную обучающую платформу с пользовательским интерфейсом и структурой обучения.
Gemini 2.5 Pro может помочь автоматизировать добавление новых функций в существующие веб-проекты. Обычно разработчики изучают файлы дизайна и пишут CSS для настройки цветов, интервалов и шрифтов. Теперь Gemini 2.5 Pro может частично автоматизировать этот рабочий процесс. В одном примере видеоплеер, стилизованный под приложение Gemini 95 starter, был добавлен в проект самой моделью.
Приложение для диктовки показывает, как быстро концептуальные идеи могут быть воплощены в рабочие приложения. Интерфейс включает анимированные волны микрофона, адаптивные макеты и ненавязчивые эффекты при наведении курсора. По словам Google, Gemini 2.5 Pro сочетает в себе чёткое понимание принципов дизайна с возможностями для точного управления пользователем.
Разработчики могут получить доступ к новой модели 2.5 через Gemini API в Google AI Studio или Vertex AI. Существующие пользователи предыдущей версии (03-25) автоматически перенаправляются на обновление (05-06). По словам Google, новая версия уменьшает количество ошибок при вызове функций и повышает частоту срабатывания функций без изменения цены. Также доступна обновлённая карта модели.
Gemini Pro 2.5 — самая мощная на данный момент модель ИИ от Google. Будучи мультимодальной системой обработки данных, она может работать с текстом, аудио, изображениями, видео и кодом. Она особенно хорошо справляется со сложными задачами, такими как тесты по математике и естественным наукам, например GPQA и AIME, и отлично подходит для задач программирования, особенно для разработки веб-приложений и преобразования кода.
Пользуясь случаем, хочу порекомендовать BotHub — платформу, где можно протестировать все популярные модели без ограничений. Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и уже сейчас начать работать!