Comments 3
Ничего не понял, но очень интересно. Наверное.
Тут на умном говорят, что глубокое обучение крутое, но вот сам принцип коррекции ошибки (обратное распространение) весов может сыграть плохую шутку с результатом. И вместо классической (?) функции активации можно посмотреть на альтернативы или менять архитектуру сети, работать (процессить) с исходными данными.
Статья понравилась – четко, кратко и по делу)
Sign up to leave a comment.
Что такое «паралич» сети, и как его избежать?