Articles / Profile of AlexErf13 / Habr

Alex Erofeev @AlexErf13

User

ProfileArticles8PostsNewsComments20

AlexErf13 Nov 18 at 07:10

Как сделать ИИ-агентов и RAG действительно автономными

Medium

4 min

640

Python * Artificial Intelligence

Tutorial

Существует проблема описанная тут (ссылка на пост в ТГ).

Суть проста — если LLM (или агенты вокруг LLM) вызывают последовательно одни и те же запросы с одним и тем же контекстом, попадание в тупик/цикл — вопрос лишь времени. То есть в случае зацикливания между агентами/контекстами надо менять промты или контекст, или последовательность вызова агентов.

Это яркая демонстрация когда агенты не смотря на всю свою сложность тупят хуже моей кошки. Кошка не будет в цикле проверять две пустые миски в поисках еды, она сделает это раз, ну или два и пойдет дальше. А агенты будут если наткнутся на такую ситуацию.

AlexErf13 Jul 22 at 14:01

Как тестировать качество ответов RAG системы?

Medium

6 min

Python * Artificial Intelligence

Review

LLM могут принимать на вход все большее кол-во токенов, но большое количество переданных на вход токенов, включая промт, контекст и историю переписки не равно качество ответа.

В идеале на вход LLM нужно передать минимально достаточный набор данных для получения ожидаемого качественного ответа.Ин

Иными словами, если на вход LLM дан один конкретный вопрос, то есть шанс близкий к 100%, чтоб будет получен качественный ответ. И наоборот, чем больше данных (вопросов, контекста и прочего) на вход LLM вы даете, тем больше вы понижаете качества ответа.

Поэтому в каждом конкретном случае нужно найти баланс минимального кол-ва данных на вход для RAG системы. То есть нужно оптимизировать промт и контекст получаемый из векторной БД для ответа на запрос пользователя.

При этом нужно определить качество ответов, то есть определить как мерять качество в конкретной RAG системе.

Минимальными вариантом будет следующий подход к измерению качества:

По каждому документу, который есть у нас, и который мы планируем векторизировать, нужно задать два вопроса:

AlexErf13 May 20 at 13:53

Как сделать RAG/ИИ-ассистента без кода

Easy

3 min

3.9K

Artificial IntelligenceThe future is hereHigh performance *

Tutorial

Если Вам нужно сконфигурировать персонального или командного AI ассистента без единой строчки кода, то инфраструктура OpenAI позволяет это сделать.

Для примера сделаем бота который может писать сообщения в стиле определенного телеграм канала. Берем канал https://t.me/+yU0dsHboVmlhNGYy. Экспортируем сообщения из канала json.

-5

AlexErf13 Apr 28 at 13:41

Как сделать RAG для своей компании

Medium

5 min

13K

Python * Artificial IntelligenceNatural Language Processing *

Tutorial

По следам:

Как я сделал RAG для своей компании

Как я сделал RAG для своей компании (часть 2). И как начал делать AI Агента

AI агенты — клоны сотрудников (часть 3)

В этой статье я постараюсь суммировать свой опыт, подвести итоги и предоставить полное решение со ссылками на Git.

AlexErf13 Apr 22 at 06:33

Создать App одним промтом

Easy

5 min

3.5K

Artificial IntelligenceHTML *

Case

Мы все уже слышали что есть сотни промтов которые могут создать полноценный App, и что скоро разработчики будут не нужны. Но давайте попробуем сделать не то чтобы App, а просто интерактивную страничку.

Мы предполагаем, что я не умею кодить и не знаю даже html. Мы засекем время и посчитаем кол-во запросов которое у меня уйдет на получение рабочей интерактивной html странички.

Затем мы попробуем, изъять из нейросети тот самый заветный один промт, который сможет воссоздать такую же страничку с нуля.

-1

AlexErf13 Mar 26 at 10:54

AI агенты — клоны сотрудников (часть 3)

Medium

4 min

7.2K

Artificial IntelligencePython *

Case

Итак, я прошел длинный путь создания RAG с нуля, и начал делать AI агентов для нашей компании.

По технологиям испробовал:

AlexErf13 Mar 11 at 07:10

Как я сделал RAG для своей компании (часть 2). И как начал делать AI Агента

Medium

6 min

7.8K

Artificial IntelligencePython *

Case

Итак, в первой части я сделал первый подход к RAG для нашей небольшой компании с большим кол-вом документов на wiki, и множеством переписок в Slack.

Стек технологий: Python, ChromaDB, простой SentenceTransformer("all-MiniLM-L6-v2"), Slack API, OpenAI API, Google Gemini API, YandexGPT API, Sber Gigachat API.

Что уже работает?

+10

AlexErf13 Mar 6 at 05:15

Как я сделал RAG для своей компании

Medium

8 min

23K

Python * Artificial Intelligence

From sandbox

Появилась свободное время, и я решил сделать RAG (Retrieval Augmented Generation) для нашей компании. Компания небольшая, но документации технической и бизнес накопилось очень много, в основном на wiki.

Цель - подключить бота в slack, который быстро может выдать инфу по нужной теме.

Источник знаний:

Читать и срочно делать свой RAG

+31