Обновить
8K+
0
Иван@KunDeal

Пользователь

3
Рейтинг
Отправить сообщение

Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели9.7K

Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе.

Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе. Веду договорную работу (поставка, подряд, услуги), сопровождаю сделки, закрываю претензионку и представляю компанию в арбитражных судах и спорах по защите прав потребителей - на стороне производителя и поставщика. К коду пришёл через вайбкодинг: захотелось автоматизировать некоторые процессы, начал ковыряться в VS Code, Trae, Cursor и Claude Code, втянулся - и теперь это параллельное хобби рядом с основной практикой.

Последние несколько месяцев пилю IP Agent - телеграм-бота, который по запросу находит релевантную судебную практику и даёт прогноз по размеру компенсации в делах об интеллектуальной собственности. Работает на RAG-пайплайне.

Когда строишь поиск по узкому домену, рано или поздно встаёт вопрос: какой эмбеддинг брать и нужен ли вообще реранкер. Готовых ответов под русскую судебную практику я не нашёл, поэтому собрал свой бенчмарк. В посте - что меряли, как меряли, что получилось и что в итоге поставил в бота.

Читать далее

Информация

В рейтинге
1 318-й
Откуда
Обнинск, Калужская обл., Россия
Дата рождения
Зарегистрирован
Активность

Специализация

Вайбкодер
Младший
Python
Базы данных
Оптимизация кода
Проектирование баз данных
Git
SQL
PostgreSQL