Комментарии 3
вот тут https://habr.com/ru/articles/723792/ я писал как LSTM реализовать простыми формулами.
Я думал статья будет из одного слова, вот так:
LSTM и GRU
Всё.
Различные варианты трансформеров победили в NLP-задачах, достичь чего-то близкого RNN не смогут by design.
Вы как-то используете рекуррентные сети сейчас, в каких задачах?
Рекуррентные нейронные сети уникальны тем, что способны обрабатывать последовательности данных, будь то тексты, временные ряды или даже музыка.
Уникальны - это значит никакой другой тип нейронной сети не может обрабатывать перечисленные типы данных. Очевидно, что это не так.
Это делает их идеальными для задач, где контекст важен, например, при генерации текста или прогнозировании временных рядов.
А для сверточных сетей контекст неважен и они так себе, посредственные? Свертка то на контексте вообще основана, разве нет?
Ну и т.п. Очень много натяжек...
LSTM и GRU