Pull to refresh
4
Dmitriy Malkevich@mkery

User

1
Subscribers
Send message

Как найти иголку в стоге сена? Или обозор Retrieval Algorithms

Level of difficultyMedium
Reading time12 min
Reach and readers6.8K

Появление трансформеров, а впоследствии LLM (Large Language Models) привело к активному распространению чат-ботов и различных ассистентов помогающих в получении информации или генерации контента. Но несмотря на то что LLM способны по запросу генерировать человекоподобные тексты, они подвержены галлюцинациям. Естественным кажется желание уменьшить количество не достоверных ответов. Для этого мы можем либо дообучить LLM на наших данных, либо использовать Retrieval Augmented Generation (RAG)

RAG - это способ генерации текстов на новых данных без дообучения модели, с помощью добавления релевантных документов в промпт модели. Документы для генерации ищутся с помощью retrieval системы, после чего объединяются в один промпт и подаются в LLM для последующей обработки. В этой статье я решил собрать информацию о всех наиболее известных и применяемых алгоритмах поиска, с описаниями и материалами для более глубокого изучения.

Читать далее

Information

Rating
Does not participate
Registered
Activity

Specialization

ML разработчик
Python
Docker
Git
C++