ITFB_Group 20 ноя 2024 в 13:43

Распределённое обучение нейронных сетей. Часть I

Средний

9 мин

1.7K

Блог компании ITFB GroupИскусственный интеллект

Обзор

Комментарии 2

vassabi 26 ноя 2024 в 13:41

интересно, что у больших моделей все плохо с повторяемотью обучения.

Т.е. процесс обучения так долог и дорог, что никто не хочет попробовать его позапускать десяток раз и "собрать статитстику". (или как там у экологов: "у нас нет второй Земли" :D )
Приходится экспериментировать и проверять гипотезы либо на небольших данных, либо на небольших моделях

ITFB_Group 27 ноя 2024 в 16:57

Да уж, про воспроизводимость тут заикаться не приходится. С другой стороны передовые модели это уже не столько про науку, сколько про бизнес. Там и тренировочные данные-то закрытые, и всякие трюки дополнительные. Из хороших новостей - в 2018ом, когда я помню коллеги жаловались, что “только Гугл может BERT тренировать”, а сегодня недельку на обычном GPU сервере - и готово!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий