olegchir May 14 at 13:53

INTELLECT-2: Первая большая (32B) параметрическая модель с распределенным обучением

Easy

5 min

3.8K

Anarchic corporate blogMachine learning*Artificial IntelligenceProgramming*Decentralized networks*

Review

+16

Comments 2

buriy May 14 at 15:38

Прикольно, конечно, но RL это от силы 10% от всей тренировки, а временами и 0.1-1%. То есть, добровольцев надо в 100 или 1000 раз больше, чтобы реально обучить модель с нуля, а не затюнить её. И ещё датасет всем надо раздать, а это терабайты. Хотя, конечно, тут можно сделать одного сидера и раздавать всем только нужные им куски датасета.

puchuu May 15 at 19:53

теоретически, это могут быть какие-то компьютеры волонтёров в интернете

А потом они поймут, что запускать обучение бесплатно никому не хочется. Затем они запустят криптовалюту с proof of train. Далее медвежий рынок, цыпки на Багамах ... и пошло и поехало.

Но в конце внезапно придёт осознание, что толку от этой распределенности не было никакой. Пока они баловались ерундой, нераспределенные системы ушли далеко вперёд.