Pull to refresh
6
0
Темченко Сергей @N3VERZzz

User

Send message

Как тестировать промпты и чейны (Ручная разметка/BERTScore/LLM as judge)

Level of difficultyEasy
Reading time5 min
Views1.3K

Представьте, что у нас есть бенчмарк из 4 тысяч вопросов и эталонных ответов. Как определить, действительно ли очередное изменение в системе (обновления в промпте, дополнительный агент в цепочке или, например, переход с базового RAG на гибридный) даёт реальный прирост качества?

Читать далее

RAG в техподдержке: проблемы и пути улучшения

Reading time3 min
Views861

Технология RAG в последнее время активно внедряется в сферу техподдержки. Однако те, кто приступает к оптимизации работы call-центров, быстро сталкиваются с множеством сложностей. Сегодня я поделюсь несколькими важными инсайтами о том, как должна выглядеть реализация такой системы.

Читать далее

Реальное внедрение LLM в бизнес-процессы (3 кейса)

Level of difficultyEasy
Reading time3 min
Views4.4K

Обзор трех кейсов внедрения LLM в крупных компаниях: Магнит, Skyeng и Точка. В них решаются разные задачи, но всех их объединяет одно: грамотное использование LLM для оптимизации процессов.

Читать далее

Почему важно тестировать промпты и как это делать

Reading time6 min
Views6.4K

Prompt Engineer — очень перспективная профессия. На рынке труда, в том числе российском, появляется всё больше вакансий с солидной зарплатой. Удивительно, но к специалистам в этой области, как правило, нет конкретных требований. Иногда кажется, что некоторые компании ищут промпт-инженеров, просто чтобы соответствовать тренду. Недавно я видел в одном из объявлений такой пассаж: «...Будет преимуществом опыт работы на смежной позиции (продактом, дата-сайентистом, разработчиком) и знание Python…». 

Если всё перечисленное — только преимущество, то что тогда считать требованиями?

Читать далее

Information

Rating
Does not participate
Registered
Activity

Specialization

Data Analyst
From 100,000 ₽
Python
SQL
Database
Git
OOP
English
Research work
Matlab
Pandas