Comments 2
Прикольно, конечно, но RL это от силы 10% от всей тренировки, а временами и 0.1-1%. То есть, добровольцев надо в 100 или 1000 раз больше, чтобы реально обучить модель с нуля, а не затюнить её. И ещё датасет всем надо раздать, а это терабайты. Хотя, конечно, тут можно сделать одного сидера и раздавать всем только нужные им куски датасета.
теоретически, это могут быть какие-то компьютеры волонтёров в интернете
А потом они поймут, что запускать обучение бесплатно никому не хочется. Затем они запустят криптовалюту с proof of train. Далее медвежий рынок, цыпки на Багамах ... и пошло и поехало.
Но в конце внезапно придёт осознание, что толку от этой распределенности не было никакой. Пока они баловались ерундой, нераспределенные системы ушли далеко вперёд.
INTELLECT-2: Первая большая (32B) параметрическая модель с распределенным обучением