Comments / Profile of mrcoolinhabr / Habr

Nikita Kulin @mrcoolinhabr

Senior NLP Engineer | RnD Team Lead | LLM Enjoyer

ProfileArticles4PostsNewsComments22

CoolPrompt: Автоматическая Оптимизация Промптов для LLM

mrcoolinhabr Oct 22 at 18:43

В качестве быстрой оптимизации нормально

CoolPrompt: Автоматическая Оптимизация Промптов для LLM

mrcoolinhabr Oct 21 at 11:27

Да, тут вы правы, у них есть полноценное решение, я говорил про DSPy в разрезе метода MIPROv2.

Если сравнивать, их решение широко охватывает реализацию и сам автопромптинг на этапах построения LLM-компонент (RAG, Агенты, другое) с помощью их собственных модулей библиотеки. То есть некая альтернатива langchain или llamaindex с авто-настройкой промптов.

На данный момент, наше решение направлено на сам этап автопромптинга. Из отличий от DSPy сейчас могу сказать - это генерация синтетического датасета для оценки промптов (при отсутствии входных данных) и интерпретация результатов оптимизации промпта.

CoolPrompt: Автоматическая Оптимизация Промптов для LLM

mrcoolinhabr Oct 21 at 09:32

Dspy - это автопромптинг алгоритм
CoolPrompt - это end-to-end решение, включающее 3 алгоритма автопромптинга для оптимизации промптов на выбор. Помимо оптимизации предоставляются другие возможности

CoolPrompt: Автоматическая Оптимизация Промптов для LLM

mrcoolinhabr Oct 18 at 09:22

Думаю, примеры такого сравнения на сложных промптах мы выложим позже (добавим в этой статье или в наш репо)

Касательно только части промпта, хорошее замечание - мы думали над тем, чтобы добавить надстройку фриза (какую часть не отправить на оптимизацию), такой запрос ранее нам тоже поступал - возьмем в работу на подумать)

CoolPrompt: Автоматическая Оптимизация Промптов для LLM

mrcoolinhabr Oct 18 at 09:10

Если речь про стандартные техники промптинга, они редко дают высокий результат

CoolPrompt: Автоматическая Оптимизация Промптов для LLM

mrcoolinhabr Oct 18 at 09:08

Это хороший вопрос

Наш метод лучше в случае: если модель по вашему запросу дала неэффективный промпт (т.е. ответ модели неудовлетворил вас), вам придется потратить время на ручную корректировку промпта.

В наших методах есть итеративный процесс поиска и улучшения промпта, при котором вы не тратите свое личное время.

В следующих экспериментах возьмем этот подход в сравнение, чтобы продемонстрировать эффективность, спасибо за идею)

Как разработать корпоративного кодового ассистента на основе LLM: от идеи до прототипа

mrcoolinhabr Sep 20 at 20:34

Это значения среднего по метрикам.

Как разработать корпоративного кодового ассистента на основе LLM: от идеи до прототипа

mrcoolinhabr Sep 20 at 20:32

1) Про этап дообучения решено вынести в отдельную статью. Помимо него будут затронуты другие темы
2) На практике не встречал таких кейсов, есть у вас примеры такого подхода?
3) LLM может сгенерировать тест с покрытием всех методов кода, может не со всеми необходимыми проверками - это вручную валидируется и корректируется. В любом случае, это в разы лучше, чем писать тесты полностью с нуля.

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров

mrcoolinhabr Jul 13 at 23:13

но как любой ответ llm, считайте это больше мнением, а не фактом - верифицировать в любом случае стоит или довериться на усмотрение

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров

mrcoolinhabr Jul 13 at 23:09

Если оптимизировать промпты обычным людям, то им нужно хотя бы посмотреть на парочку хороших промптов и как они выстраиваются - этого достаточно. Как вариант, начинать с основного запроса и далее детализировать, делать яснее и конкретизировать - как бы вы объясняли человеку, что вы от него хотите.

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров

mrcoolinhabr Jul 13 at 09:26

"Да и зачем вам эти «инженеры» если вы подключаете к одной llm другую llm?" - среди упомянутых мною методов такого подхода нет) не знаю, откуда вы это взяли

Искусство общения с LLM: Гайд по техникам Prompt Engineering

mrcoolinhabr Jul 12 at 21:06

На практике всегда ответы модели верифицируются, нет гарантий не получить галлюцинации

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров

mrcoolinhabr Jul 12 at 21:05

Практика и научные исследования как раз подтверждают, вы не до конца изучили этот момент, если такое пишите

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров

mrcoolinhabr Jul 12 at 21:04

Согласен с тем, что у вас нестандартный взгляд)
1) "кажется логичным получать образование и его использовать, понимать что-то на самом деле самому, не полагаясь во всём на нейронки" - в посте эта тема вообще никак это не затрагивается, не вижу смысла продолжать
2) весь второй абзац - просто тезисы вне реальности, вы не можете понять о чем и для чего статья? - тогда она не для вас)

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров

mrcoolinhabr Jul 12 at 19:12

Касательно полезности интересный момент: ведь это полезно не только промпт-инженерам, но и обычным людям, которые вне контекста ИИ и буквально находятся в использовании ИИ на уровне новичка (зачастую из-за этого они не получают нужного ответа)
И тут есть выбор:
1) Платить за курсы промпт-инжиниринга
2) Помочь пользователям в подсказках, как составлять промпт, с помощью автопромптинга

Кажется, что логичный и более продуктивный выбор 2)

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров

mrcoolinhabr Jul 11 at 20:27

Это больше про сложные с точки зрения постановки задачи и инструкций. И здесь не идет речь о нескольких LLM-ках, в рассмотренных алгоритмах используется одна модель.

Знакомьтесь, FRIDA. Открытая эмбеддинг-модель для русского языка

mrcoolinhabr May 21 at 18:24

Моделька топ, очень хороша в поиске. Ставлю лайк 👍🏻

RAG (Retrieval-Augmented Generation): основы и продвинутые техники

mrcoolinhabr Apr 29 at 13:08

Спасибо за замечание, по второй ссылке видимо они перенесли страницу, обновил

Как я победил в RAG Challenge: от нуля до SoTA за один конкурс

mrcoolinhabr Mar 23 at 10:20

Илья, спасибо за статью, крутая работа!

Корректировку relevance score производил взвешенным средним

vector_weight = 0.3, llm_weight = 0.7

Были другие эксперименты с весами корректировки - 50/50? Как были выбраны финальные коэффициенты?