Всего через день после презентации OpenAI, на которой была представлена новая модель GPT-4о и десктопная версия ChatGPT, компания Google провела свою ежегодную конференцию для разработчиков Google I/O 2024. На мероприятии Google анонсировала множество новых продуктов, обновлений и инициатив в области ИИ и машинного обучения, демонстрируя, что не намерена уступать лидерство в этой сфере своим конкурентам.
Что было анонсировано на Google I/O 2024:
Обновления языковой модели Gemini:
Google добавит новую языковую модель Gemini 2 с 27 миллиардами параметров. Она оптимизирована компанией Nvidia для работы на графических процессорах нового поколения и может эффективно работать на одном TPU-хосте и Vertex AI.
Также анонсирована улучшенная версия Gemini 1.5 Pro, которая сможет анализировать в два раза больше данных, чем раньше - до 2 миллионов токенов. Это самый большой объем входных данных среди всех коммерчески доступных моделей.
Интеграция Gemini в сервисы Google:
Gemini будет интегрирован в Gmail, позволяя пользователям искать, обобщать и составлять черновики писем с помощью ИИ. Он также сможет выполнять более сложные задачи, такие как обработка возврата товара в интернет-магазине.
В Android 15 появится функция Gemini Live, позволяющая пользователям вести полноценные голосовые беседы с ИИ-помощником, который сможет видеть и реагировать на окружение пользователя через камеру смартфона.
Gemini Nano, самая компактная модель ИИ от Google, будет встроена прямо в десктопный клиент Chrome, начиная с версии 126. Это позволит разработчикам использовать ИИ-модель на устройстве для создания собственных функций.
В Google Maps разработчики смогут использовать возможности Gemini для создания ИИ-описаний мест и областей на основе данных от сообщества Google Maps.
ИИ в поиске Google:
Google добавляет больше ИИ-возможностей в свою поисковую систему, чтобы конкурировать с такими сервисами, как ChatGPT. Для некоторых результатов поиска будут создаваться полностью сгенерированные ИИ обзоры.
Функция Ask This Video позволит пользователям YouTube искать конкретную информацию внутри видео с помощью Gemini.
Новые ИИ-инструменты:
Представлен Veo - ИИ-модель, способная создавать видеоклипы в разрешении 1080p длительностью около минуты на основе текстового описания. Veo может передавать различные визуальные и кинематографические стили и редактировать уже сгенерированные кадры.
Анонсирован Imagen 3 - новейшая версия модели генерации изображений от Google. Она более точно понимает текстовые запросы, генерирует более креативные и детализированные изображения и лучше обрабатывает текст.
Обновления аппаратного обеспечения:
Google представила процессоры Tensor Processing Unit (TPU) 6-го поколения под названием Trillium. Они предлагают прирост производительности в 4,7 раза по сравнению с предыдущим поколением и будут запущены позже в этом году.
Компания также представила новый смартфон Pixel 8a, оснащенный чипом Tensor G3, и планшет Pixel Slate.
Улучшения для разработчиков:
В магазине приложений Google Play появятся новые функции для открытия приложений, привлечения пользователей и улучшения инструментов для разработчиков, таких как Google Play SDK Console и Play Integrity API.
Анонсирован Firebase Genkit - фреймворк с открытым исходным кодом, позволяющий разработчикам быстро интегрировать ИИ в свои приложения на JavaScript/TypeScript и вскоре на Go.
Среда разработки Project IDX теперь доступна в открытой бета-версии с интеграцией Google Maps Platform, Chrome Dev Tools, Lighthouse и скорой возможностью развертывания приложений в Cloud Run.
Итого: Google явно не собирается сидеть сложа руки и смотреть, как OpenAI и другие конкуренты уводят у них из-под носа возможность лидировать на рынке. На Google I/O 2024 компания показала, что у нее есть свое видение будущего ИИ, и она активно работает над его воплощением.
Улучшенные языковые модели, интеграция ИИ во все основные сервисы Google, новые инструменты для разработчиков - все это доказывает, что Google серьезно настроена стать лидером в сфере ИИ-технологий. Так что, похоже, нас ждет захватывающая битва гигантов на этом поле.
Кто окажется победителем - пока вопрос открытый, но одно можно сказать точно: от этой конкуренции выиграют в первую очередь пользователи и разработчики, которые получат доступ к передовым ИИ-инструментам и сервисам.
Спасибо за прочтение! Расскажите, что из анонсов вас заинтересовало больше всего:)