Комментарии / Профиль Rai220 / Хабр

Константин Крестников@Rai220

AI agents developer (e/acc)

Подписчики

ПрофильСтатьи8ПостыНовостиКомментарии281

GigaMemory: научи ИИ «помнить всё» с AI Journey Contest 2025

Rai220 19 окт 2025 в 06:25

Участвую чуть-чуть, втянулся, интересно. Спасибо организаторам!

Жалко, что в соревнование используется прямой инференс от модели, а не ваш же api. В результате сложно использовать уже готовые наработки, тот же mem0. Ну то есть можно конечно, но через костыли, которые надо ещё и отладить на удаленном проверяющем сервере без логов.

Зоопарк фреймворков для AI-агентов: как выбрать подходящий — делаем бенчмарк и большое сравнение

Rai220 3 окт 2025 в 14:24

Я бы еще популярность в сообществе бы добавил. Можно грубо оценить по количеству звездочек на github:

LangChain - 117k
AutoGen - 50k
LlamaIndex - 44k
CrewAI - 39k
Semantic Kernel - 26k
Smolagents - 23k
Google ADK - 13k

GigaChat 2.0 в API

Rai220 25 мар 2025 в 05:27

Как и обещал, выкладываю версию конфигов для работы Aider + gigachat: https://github.com/ai-forever/gpt2giga/tree/main/integrations/aider

GigaChat 2.0 в API

Rai220 13 мар 2025 в 18:44

В ближайшее время выложим инструкцию по запуску aider (и других code-агентов) через утилиту gpt2giga, которая позволяет использовать гигачат в приложениях, расчитанных на работу с openai api. Будет прямо в репозитории.

GigaChat MAX — новая, сильная модель GigaChat

Rai220 6 ноя 2024 в 17:58

Да, прошу прощения, я почему-то про logprobs решил ответить.

GigaChat MAX — новая, сильная модель GigaChat

Rai220 6 ноя 2024 в 14:24

Этот подход ориентирован на plain text LLM. Обратите внимание, что к примеру gpt-4 в этих библиотеках или вообще не поддерживается или работает лишь для галочки (не использует по факту logprobs). Тем не менее на Gpt-4/4o вполне себе прод-решения делают :)

В чатовых моделях альтернативой можно считать функции с принудительным вызовом. Фактически они позволяют получить тоже самое - заставить LLM вернуть структурированые данные.

Какой плащ был у Понтия Пилата? Отвечает GigaChat

Rai220 27 фев 2024 в 11:56

Добрый день!
1. Не, UI был сделан на SDK streamlit. Очень крутая штука для тех, кто не умеет делать UI :) Примерчек можно глянуть тут (задача решается другая, но суть та же самая) - https://github.com/ai-forever/gigachain/blob/master/libs/streamlit_agent/gigachat_streaming.py

2. Посмотрите на DirectoryLoader, как раз для вашего случая!
loader = DirectoryLoader('../', glob="**/*.txt", show_progress=True)
docs = loader.load()

3. В txt номеров страниц обычно уже нет, поэтому TextSplitter'ы не умеют добавлять метаданные. Из коробки это умеют делать только сплиттеры для *.md и html. Обратите внимание на MarkdownHeaderTextSplitter , он умеет добавлять в мету заголовки и подзаголовки. Если сконвертировать нужную книгу в этот формат, то должно быть хорошо. Но я не пробовал.

Какой плащ был у Понтия Пилата? Отвечает GigaChat

Rai220 21 фев 2024 в 09:35

В моих примерах используется GigaChat - эта модель доступна исключительно в облаке по API. Если хочется локально работать, то нужно поднять свою модель, например маленькую версию llama или mixtral. Gigachain и Langchain позволяют это сделать, но это уже не так просто, как получить креды к API. Но в целом реально за вечерок всё настроить и поднять.

Какой плащ был у Понтия Пилата? Отвечает GigaChat

Rai220 21 фев 2024 в 09:33

Такое сравнение будет не корректным. Если документ целиком можно положить в промпт, то надо его класть. RAG нужен в тех случаях, когда документ в промпт не получается.

Вероятно, с появлением сетей с 1М контекстом эта технология станет не столь актуальной.

Какой плащ был у Понтия Пилата? Отвечает GigaChat

Rai220 21 фев 2024 в 09:31

Спасибо! Пользуйтесь, с помощью langchain / gigachain очень много чего ещё интересного можно реализовать.

Переносим свою картину мира в чат-бота на базе GPT-3

Rai220 12 апр 2023 в 07:31

Крайне маловероятно. Скорее тренируется только веса выходного слоя. Как сказал кто-то из разработчиков в интервью, файнтюнинг не добавляет новых знаний в модель, они и так там все есть, а лишь говорит, какие именно знания пользователь предпочитает получить.

Приделываем руки к ChatGPT: бот, который исполняет код в рантайме

Rai220 22 мар 2023 в 19:11

2-3 итерации, если не получается, то дальше процесс становится вырожденным и смысла почти всегда нет.

Приделываем руки к ChatGPT: бот, который исполняет код в рантайме

Rai220 22 мар 2023 в 12:29

Не упоминал. Но он все равно ими пользуется, поэтому для стабильной работы пришлось добавить то на что он ссылался.

Приделываем руки к ChatGPT: бот, который исполняет код в рантайме

Rai220 22 мар 2023 в 12:21

Только вчера про него узнал, так то стоило бы.

Приделываем руки к ChatGPT: бот, который исполняет код в рантайме

Rai220 22 мар 2023 в 12:10

Я честно говоря ждал чего-то подобного, но пока выйти из-под контроля он не пытался. Ждём gpt-5.

Приделываем руки к ChatGPT: бот, который исполняет код в рантайме

Rai220 22 мар 2023 в 12:09

Встал в лист ожидания сразу и на следующий день получил, возможно повезло.

Доступ к боту не публикую, так как выходит довольно дорого, особенно учитывая то, что при запуске кода он делает несколько обращений. Но его без проблем можно запустить и на gpt-3.5

Переносим свою картину мира в чат-бота на базе GPT-3

Rai220 3 фев 2023 в 07:16

Звучит так, что их можно просто алгоритмическим чат-ботом заменить ) Можно взять какой-нибудь zero-code конструктор, вроде chatfuel и на нем реализовать замену девочкам.

Переносим свою картину мира в чат-бота на базе GPT-3

Rai220 30 янв 2023 в 17:47

Добрый день, ответил вам в личку.

Переносим свою картину мира в чат-бота на базе GPT-3

Rai220 25 янв 2023 в 05:30

Да, никаких проблем с этим нет.

Как научить телефон видеть красоту

Rai220 29 янв 2020 в 08:38

Спасибо за интересную статью! Вижу пару интересных кейсов:
1. Выбор фото с максимальной оценкой из серии селфи
2. Предложить вариант косметики/прически, которая максимизирует оценку

2 3 ...

14 15