slivka_83 29 апр 2024 в 15:34

Подбор гиперпараметров RAG-системы с помощью Optuna

Средний

16 мин

9.2K

Python * Data Mining * Машинное обучение * Искусственный интеллектNatural Language Processing *

Туториал

+15

Комментарии 3

slivka_83 3 мая 2024 в 06:51

Докинул bi-энкодеров, расширил границы chunk_size и n_top_cos, добавил в сплитеры цепочки символов. В результате получил скор 85.95% на том же датасете. А учитывая правильные ответы среди неправильных то и все 90-95%

PorisulkiP 17 фев в 20:33

Работа на одной GPU A100 40Мб.

Наверное 40ГБ

А касаемо темы статьи, то что по временным затратам? Я сам пытался устроить себе подобный эксперимент по рабочей задаче, но нужны прям уходить по делам и на что-то отвлекаться, пока идёт подбор. Ситуация "первые 15 экспериментов длинною в 10 часов выдали val_loss inf" даже более жизненна, чем хотелось бы)

slivka_83 18 фев в 07:48

Спасибо поправил.

Я себе создал тест на 100 вопросов. За 24 часа провожу прмимерно 200-400 тестов в зависимости от модели.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий