Комментарии / Профиль MKonova / Хабр

Марина Конова@MKonova

ИТ-директор

35,1

Рейтинг

Подписчики

ПрофильСтатьи1ПостыНовостиКомментарии3

RAG вместо GPT: как мы сделали внутреннего ассистента для корпоративных данных

MKonova 27 мар в 13:30

Спасибо за мнение. С интересом почитаю вашу статью про ваш опыт.

RAG вместо GPT: как мы сделали внутреннего ассистента для корпоративных данных

MKonova 27 мар в 11:41

Да, согласна, мы также столкнулись с такой проблемой, и по этой причине возникли такие сложности при разработке и адаптации. На специально подготовленных данных (с вырезанным "мусором"и т.п.) современные RAG-системы работают достойно “из коробки”. Но нашей целью было сделать решение, которое давало бы хотя бы удовлетворительный результат для более-менее случайного набора документации. И тут уже в ход пошли кастомные подходы и решения, начиная от варьирования размера чанков в зависимости от типизации документа, заканчивая разными подходами к финальной обработке на LLM-ранжированной выборке. Ну и конечно, без административных рекомендаций никуда: для более стабильных результатов мы рекомендуем сотрудникам приводить документы к текстово-описательному виду, исключая по возможности любые решения визуального характера. Но, как понимаете, в условиях крупной ИТ-компании, это носит скорее рекомендательный характер)

Что касается локальных моделей: мы пробовали самые разные, как в плане семейств, так и в плане количества параметров. На данный момент остановились на Квене, так как он наиболее гибко себя ведет и на больших чанках, и на большом количестве разрозненных маленьких, давая при этом приемлемую скорость. По соотношению баланса скорости и качества выбрали эту модель. Но это на данный момент - процесс поиска наилучшей модели, особенно ввиду стремительности их развития, прекращать нельзя никогда.

RAG вместо GPT: как мы сделали внутреннего ассистента для корпоративных данных

MKonova 27 мар в 09:29

Наличие 1000 и 1 решения на рынке означает, что ни одного по-настоящему хорошего решения нет - иначе именно оно бы этот рынок и захватило.

Проблемы RAGа не в том, чтобы настроить на статичной базе знаний более-менее нормального ассистента, а в том, чтобы обеспечить работу с универсальными документами - чтобы ваш RAG подходил для любого загруженного документа и выдавал достойный результат - тут проблемы возникают как на поиске фрагментов по векторной базе данных, так и по выстраиванию баланса креативности и точности.

Любая компания, которая сделает RAG совершенно стабильным и универсальным - озолотится, потому что потребность в нем колоссальна. Но отсутствие таких универсальных решений на рынке говорит о том, что задача не так проста, как кажется. А опенсорсные решения - не так хороши.

Ну, а если задача - поднять RAG ради RAGа для отчета перед руководством, то, конечно, можно и за полдня поднять)

В рейтинге: 264-я

Откуда: Москва, Москва и Московская обл., Россия

Работает в: КРОК

Зарегистрирована: 25 марта

Активность: 30 марта в 13:44

Технический директор

Управление людьми

Управление проектами

Оптимизация бизнес-процессов

Автоматизация процессов

Информационные технологии

Управление бизнес-процессами

Стратегическое планирование

Организация бизнес-процессов

Информация

Специализация