Как стать автором
Обновить

Генерация ответов с расширенным поиском в техподдержке на основе YandexGPT, ChatGPT

Уровень сложностиСредний
Время на прочтение20 мин
Количество просмотров7.5K
Всего голосов 2: ↑2 и ↓0+2
Комментарии8

Комментарии 8

Было бы круто, если бы вы показали пак стандартных вопрос в техподдержку, и те ответы, которые дает YandexGPT

Работа программы на реальных вопросах продемонстрирована здесь

В Пример № 1 похоже что yandexgpt дает нерелевантный ответ. Было удобнее оценить работу yandexgpt, если бы ответы были разобраны или хотябы помечены как релевантный, полный, точный.

я немного поэкспериментировал с yandexgpt, пробовал подружить с llama index, так вот с дефолтными промптами (в llama index они на английском языке) ответы генерируются совсем нерелевантный, yandex gpt игнорирует инструкции вида "Используй только инофрмацию из контекста и не используй предыдущий знания" в результате в ответах появляется нерелелевантная информация. У кого то получилось подобрать эффективные промпты YandexGPT для RAG?

Занимаюсь похожим pet проектом и в документации YandexGPT наткнулся на 2 доступные модели для генерации ембеддингов: emb://text-search-query и emb://text-search-doc — не знаете в чем между ними разница и используете именно query?

Разница в используемых методах для генерации векторных представлений по тексту. Это общая практика при работе, например, с текстовым поиском по какому-либо сету документов: https://python.langchain.com/docs/modules/data_connection/text_embedding/

  • EMBEDDING_TYPE_QUERY: Embedding for a query. Use this when you have a short query or search term that you want to obtain an embedding for. Query embeddings are typically used in information retrieval and search applications.

  • EMBEDDING_TYPE_DOCUMENT: Embedding for a document. Use this when you have a longer document or a piece of text that you want to obtain an embedding for. Document embeddings are often used in natural language understanding and document similarity tasks.

А я подумал, что Document нужно использовать чтобы векторизовать документы, а query для того чтобы векторизовать запросы по поиску документов) В документации ynadexgpt недоработока, ничего не не написано про это ...

Подарок в Новогоднюю Ночь - я оценил, спасибо!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории