«Сбер» на конференции ACL 2025 представил новую модель для улучшения поиска и создания чат-ботов GigaEmbeddings / Habr

Исследователи «Сбера» создали модель GigaEmbeddings, которая улучшает поиск и создание чат-ботов, . По словам разработчиков, новая модель помогает бизнесу обрабатывать русский язык с помощью искусственного интеллекта. Статья, посвящённая GigaEmbeddings, была представлена на конференции ACL 2025. В работе описана сама модель обработки текстов.

GigaEmbeddings построена на основе GigaChat-3B. Новая модель проходила три этапа обучения: предварительное обучение, точная настройка и мультизадачное обучение. Архитектура оптимизирована, параметры модели уменьшены на 25%, но качество не пострадало. Модель доступна на GitVerse и HuggingFace.

Как объяснили в «Сбере», ранее бизнесу не хватало хороших инструментов для работы с русским языком. Существующие решения либо требовали больших вычислительных ресурсов, либо плохо решали задачи поиска, классификации и кластеризации текстов. GigaEmbeddings решает эти проблемы.

Модель GigaEmbeddings подходит для таких задач, как умный поиск в e‑commerce (например, понимание запросов на маркетплейсах), создание чат‑ботов с расширенными возможностями (RAG‑системы), анализ обращений клиентов в банках и финтехе, а также для персонализированных рекомендаций в медиа и ретейле.

Технический директор GigaChat «Сбербанка» Фёдор Минькин заявил, что GigaEmbeddings закрывает потребность рынка в качественных NLP‑решениях для русского языка. Платформа помогает бизнесу оптимизировать работу с текстами — от поиска и рекомендаций до передовых RAG‑систем в чат‑ботах.