Обновить

Подбор гиперпараметров RAG-системы с помощью Optuna

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров9.2K
Всего голосов 13: ↑13 и ↓0+15
Комментарии3

Комментарии 3

Докинул bi-энкодеров, расширил границы chunk_size и n_top_cos, добавил в сплитеры цепочки символов. В результате получил скор 85.95% на том же датасете. А учитывая правильные ответы среди неправильных то и все 90-95%

  • Работа на одной GPU A100 40Мб.

Наверное 40ГБ

А касаемо темы статьи, то что по временным затратам? Я сам пытался устроить себе подобный эксперимент по рабочей задаче, но нужны прям уходить по делам и на что-то отвлекаться, пока идёт подбор. Ситуация "первые 15 экспериментов длинною в 10 часов выдали val_loss inf" даже более жизненна, чем хотелось бы)

Спасибо поправил.

Я себе создал тест на 100 вопросов. За 24 часа провожу прмимерно 200-400 тестов в зависимости от модели.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации