VK внедрила визуально-языковые модели ИИ в поиск своих сервисов / Хабр

Компания VK начала внедрять в поиск своих продуктов визуально‑языковые модели (VLM). VLM) представляют собой искусственный интеллект, который одновременно анализирует текст, изображения, звук и видеоряд. Технология уже работает в «VK Видео». Она появится в других сервисах компании, где есть поисковые системы.

Модель учитывает название и описание загруженного на платформу контента. Она также анализирует его смысл. Это позволяет точнее отвечать на поисковые запросы пользователей. Новая разработка от инженеров AI VK автоматически формирует датасеты. Эти данные о контенте помогают поисковым алгоритмам определять, какое видео подходит к запросу, а какое нет.

С запуском модели в будущем улучшится векторный поиск в продуктах VK. Он основан на семантическом значении запроса. Система будет понимать, что пользователь чаще выбирает видео с определённым стилем монтажа и цветокоррекции. Модель точнее распознает гибридные запросы, где текст и визуальные характеристики комбинируются.

Поисковая выдача станет более персонализированной. Как рассказали в VK, внедрение визуально‑языковых моделей ускорит в пять раз разработку и масштабирование новых технологий. Это поможет развитию и улучшению поиска во всех продуктах VK.