Комментарии / Профиль khmelkoff / Хабр

Игорь Хмельков@khmelkoff

Data Scientist

Рейтинг

Подписчики

ПрофильСтатьи14ПостыНовостиКомментарии56

Как мы с Claude Code учились оценивать качество RAG системы

khmelkoff 19 июн в 06:00

Спасибо. Отличный вопрос!

А ваши задачи без rag не решаются? Например положить все данные просто файлом рядом с моделью если это возможно.

В API Anthropic есть система кеширования, кэш живёт 5 минут. Если мы работаем с одним и тем же документом, то его можно закешировать и сэкономить на токенах. Качество ответов будет выше, чем у простейшей RAG системы. Картинка с дашбордом как раз этот эффект показывает. Дело в том, что бенчмарк синтетический. Я его сделал на gemma4:31b. Она получала тему для вопроса, но видела весь документ целиком, поэтому RAG уступает по качеству там, где в метрике используется "правильный" ответ.

модель куда эффективнее сама искал необходимую часть документа базовыми unix инструментами, чем получая избыточные данные от rag

Если RAG - просто векторный поиск, так скорее всего и будет. Сравнительно новые архитектуры предполагают использование в RAG агентов и LLM-судьи. В зависимости от его решения может адаптивно меняться количество чанков в выдаче, переформулироваться и дополняться вопрос, или вообще отключаться выдача, если LLM-судья решил, что для этого вопроса RAG не нужен.

Как мы с Claude Code учились оценивать качество RAG системы

khmelkoff 18 июн в 14:51

Здравствуйте. Там всё на питоне и написано. инструменты, библиотека, rag система. ещё немного маркдауна, html и JavaScript. Статья в том числе и про то, как всё-равно пришлось написать код.

RAG в enterprise: 70-80% проблем не в модели, а в данных

khmelkoff 18 мая в 14:47

Не знаю какие причины у Автора, но бывает, что VRAM на RAG вообще не выделяют. Там же не один поток в проде может быть, а например восемь одновременно, одна домашняя видеокарта не спасёт, а на CPU как-то работает.

Вам не нужен OpenClaw — напишите свой

khmelkoff 14 мая в 09:34

Так и я про это, только с другой стороны ) Высокие риски -> практики мало -> мало экспертизы -> низкая культура внедрения. А туториал ваш мне понравился.

Вам не нужен OpenClaw — напишите свой

khmelkoff 14 мая в 09:16

ОПАСНО, хостим свои модели

Вы не думали что это ключевое отличие? В остальном, кажется обвинять российские компании в некомпетентности не совсем правильно. Есть как минимум три серьезных бизнес риска. Первый - аккаунт в любой момент заблокируют владельцы моделей из-за нарушения пользовательского соглашения. Второй - доступ к зарубежным моделям заблокируют по локальным причинам. Третий - стоимость токенов может вырасти кратно. Сейчас же прайс ниже себестоимости (поправьте меня, если ошибаюсь)? Поэтому он-прем и прочие аир-гэпы, поэтому чат-боты с локальными моделями. Несмотря на это, есть компании, которые уже поставили себе лейбл AI-Native.

+15

Как Gemma и LangGraph написали законопроект победившего биопанка

khmelkoff 5 мая в 09:10

Когда я только настраивал промпты, не было ограничения на "клонированные и синтетические" организмы. Вы не поверите, но у меня волосы вставали дыбом от того, что генерила gemma в тестовых запросах.

RAG: Как собрать свой ретривер для особых случаев

khmelkoff 25 апр в 15:24

Загрузил в репозитарий. проверяйте

RAG: Как собрать свой ретривер для особых случаев

khmelkoff 16 апр в 10:38

КДПВ в статье не показывается, только в ленте. Попробуйте поиском "RAG: Как собрать свой ретривер", она там будет на втором или третьем месте.

RAG: Как собрать свой ретривер для особых случаев

khmelkoff 15 апр в 10:00

Спасибо! Собаку поменял )

PageIndex: замена векторному поиску в RAG?

khmelkoff 3 апр в 06:40

Qwen3.5 27B пробовал. Инференс не стартует, остановил. Нужно разобраться, возможно обновить ollama. Говорят, хорошая модель. Получится запустить - сделаю апдейт.

NER для русского языка в Spacy 3: удобно и легко

khmelkoff 13 июл 2022 в 11:23

Спасибо за статью, с удовольствием попробовал!
В функции make_docs список файлов лучше брать из annotated, у файлов из raw не у всех есть пара.

Reformer — Эффективный Трансформер

khmelkoff 17 авг 2021 в 14:42

У меня получилось на trax 1.3.6. Попробовал и TPU и GPU, но тексты были короткими.

Reformer — Эффективный Трансформер

khmelkoff 16 авг 2021 в 15:44

В Trax версии 1.3.7 в реформер не получалось загрузить веса. Старая ошибка, которую в 1.3.4 вроде бы исправляли. У Вас вышло?

Книга «Обработка естественного языка. Python и spaCy на практике»

khmelkoff 23 мая 2021 в 15:05

Купил. С примерами да, проблема. По-моему spacy сейчас уже работает с русским языком.
Ну хоть шрифт нормальный, можно в транспорте почитать. «Обработку естественного языка в действии» изд. Питер — только при ярком свете днём или под стоваттной лампой.

Йога глазами дата-сайентиста: как мы строили computer vision в мобильном приложении

khmelkoff 30 апр 2021 в 14:24

Отличная идея использовать всего две точки на шее и подбородке, чтобы показать поворот головы! Красиво. Удачи Вам!

Что такое machine learning?

khmelkoff 29 апр 2021 в 13:32

Да, точно, вложение!

Что такое machine learning?

khmelkoff 29 апр 2021 в 13:05

Да, Вы правы, bias — смещение, смещенность. Но я имел в виду именно предвзятость. Последнее время встречаю немало публикаций на эту тему. Что-то вроде «can be interpreted as one group's prejudice based on a particular categorical distinction». Западные коллеги даже Embeddings (векторные пространства слов, кажется Вы предложили вариант «внедрения», на мой взгляд — вполне удачный) корректируют, что бы избежать обвинений в сексисзме.

Что такое machine learning?

khmelkoff 29 апр 2021 в 12:25

Но модель в силу алгоритма усвоения внутри нее улавливает неразличимые для человека сведения уже сама.

Это только часть моделей. А для другой части нужно разметить данные, т.е. «показать» алгоритму, что правильно, что нет, что искать на изображении, каким должно быть удачное «саммари» для текста. Процесс разметки данных или подготовки правильных ответов может занимать 99% времени проекта.

Возможно Вам будет интересно, среди моих коллег термин модель применяется только к обученной модели, ну или по вашему, модели, усвоившей знания. Пока процесс не завершен, это, например, машина или алгоритм и никакой ценности она не представляет, какой бы сложной не была её архитектура.

Что такое machine learning?

khmelkoff 29 апр 2021 в 10:47

Поставил плюс статье за Вашу позицию и то, как Вы её отстаиваете.
Тема действительно интересная. На мой скромный взгляд практикующего DS, оба термина, и обучение и усвоение не очень удачны. Обучение, потому что процесс больше похож на тренировку. Почти всегда в коде есть модуль «train» и также называется часть данных, которая используется в этом процессе.

Термин «усвоение» мне непривычен, но проблема не только в нём. Проблема — в знаниях, которые машина должна усваивать. Мне всегда казалось, что знания должны быть как-то связаны с индивидом, с отражением действительности в сознании, которым пока машины не обладают. На мой взгляд то, что приобретает машина на данном уровне развития технологий больше похоже на интуицию.

Пожалуй «усвоение» еще как-то выключает меня из процесса (а это обидно). Да, есть такие системы, где роль исследователя данных минимальна, но в основном, это я подбираю для машины кейсы, я оцениваю как и сколько она учится, я слежу за качеством модели и иногда за предвзятостью, и да, это я подкручиваю гиперпараметры.

Интересно, что термин «знания» в оригинальной статье упоминается только два раза, в определении Dr. Yoshua Bengio. И там не очень понятно, это относится к ML или AI.

-1

Как мы выбирали библиотеку машинного обучения для работы с естественным языком

khmelkoff 20 апр 2021 в 15:28

Если будете еще экспериментировать, попробуйте RuBERT. Она помещается на 8ГБ GPU, если размер сообщения не больше, чем 64 токена.

2 3