Как стать автором
Обновить
390.26
BotHub
Агрегатор нейросетей: ChatGPT, Claude, Midjourney

Google расширяет возможности помощника Gemini: анализ видео и демонстрация экрана

Время на прочтение2 мин
Количество просмотров1.8K

Google интегрирует технологию анализа видео в реальном времени в своего помощника Gemini. Об этом компания сообщила на Mobile World Congress.

Google представляет функции искусственного интеллекта для своего помощника Gemini на Всемирном мобильном конгрессе (MWC) в Барселоне. Компания объявила, что подписчики Google One AI Premium для Gemini Advanced получат доступ к функциям потокового видео и демонстрации экрана в конце этого месяца.

В Gemini Live появятся две новые важные функции: во-первых, возможность анализировать видео в реальном времени, а во-вторых, функция демонстрации экрана. С помощью обеих функций пользователи смогут делиться визуальным контентом с ИИ-помощником в режиме реального времени — в случае с видео в реальном времени через изображения с камеры, а в случае с демонстрацией экрана — через экран своего смартфона, чтобы получать комментарии к контенту.

Новые функции изначально доступны только на устройствах Android и поддерживают несколько языков. На MWC компания Google продемонстрирует интеграцию этих функций на устройствах-партнёрах от различных производителей Android.

Добавление визуальных функций — важный шаг в развитии ИИ-помощников, которые, как ожидается, будут всё чаще действовать мультимодально и взаимодействовать с реальным миром.

Цель Google на 2025 год — проект «Astra», универсальный мультимодальный ИИ-помощник, который может обрабатывать текстовые, видео- и аудиоданные в режиме реального времени и сохранять их в контексте диалога до десяти минут. Astra также сможет использовать Google Поиск, Lens и Карты.

Неизвестно, планирует ли Google на самом деле выпустить Astra или, что более вероятно, будут ли функции, представленные для Astra, интегрированы в Gemini.

С помощью Gemini Live Google позиционирует себя как конкурента OpenAI и его ChatGPT: с декабря в расширенном голосовом режиме ChatGPT появилась поддержка трансляции в реальном времени и демонстрации экрана.

Источник

Теги:
Хабы:
Всего голосов 3: ↑3 и ↓0+4
Комментарии2

Другие новости

Информация

Сайт
bothub.chat
Дата регистрации
Дата основания
Численность
11–30 человек
Местоположение
Россия
Представитель
Вероника