Комментарии 8
Было бы круто, если бы вы показали пак стандартных вопрос в техподдержку, и те ответы, которые дает YandexGPT
В Пример № 1 похоже что yandexgpt дает нерелевантный ответ. Было удобнее оценить работу yandexgpt, если бы ответы были разобраны или хотябы помечены как релевантный, полный, точный.
я немного поэкспериментировал с yandexgpt, пробовал подружить с llama index, так вот с дефолтными промптами (в llama index они на английском языке) ответы генерируются совсем нерелевантный, yandex gpt игнорирует инструкции вида "Используй только инофрмацию из контекста и не используй предыдущий знания" в результате в ответах появляется нерелелевантная информация. У кого то получилось подобрать эффективные промпты YandexGPT для RAG?
Занимаюсь похожим pet проектом и в документации YandexGPT наткнулся на 2 доступные модели для генерации ембеддингов: emb://text-search-query
и emb://text-search-doc
— не знаете в чем между ними разница и используете именно query?
Разница в используемых методах для генерации векторных представлений по тексту. Это общая практика при работе, например, с текстовым поиском по какому-либо сету документов: https://python.langchain.com/docs/modules/data_connection/text_embedding/
EMBEDDING_TYPE_QUERY: Embedding for a query. Use this when you have a short query or search term that you want to obtain an embedding for. Query embeddings are typically used in information retrieval and search applications.
EMBEDDING_TYPE_DOCUMENT: Embedding for a document. Use this when you have a longer document or a piece of text that you want to obtain an embedding for. Document embeddings are often used in natural language understanding and document similarity tasks.
Подарок в Новогоднюю Ночь - я оценил, спасибо!
Генерация ответов с расширенным поиском в техподдержке на основе YandexGPT, ChatGPT