Комментарии 3
>просто посмотрите, что сети на основе Attention используют такие компании как Гугл, Фэйсбук, Сэйлфорс
Так, это что за космополитан? Я не за модой следить сюда захожу
Модели на внимании, которые должны заметно побивать RNN и LSTM на их задачах, для обучения требуют очень большого количества данных и времени на обучение.Под GPT3 аж специальную инфраструктуру пришлось выстраивать. Так что в полной мере их использовать могут только эти Гугл, Фейсбук и Сэйлфорс.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Упадок RNN и LSTM сетей