Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
эх, ностальгия, нахождение экстремумов, золотое сечение, градиентный метод, линейное программирование, канторович с фанерным трестом… жаль спустя 15 лет всё вылетело из головы, хочется освежить память, но мобильный браузер ни в какую не хочет отображать формулы)
требуют специфических дополнительных вычислений, которые обычно более вычислительно затратны, нежели вычисление градиента
но не уверен, что умеет использовать разреженность матриц
Тем не менее, если этот текст будет востребован, я с удовольствием сделаю подобный обзор и по ним.
Спасибо за статью. Могли бы вы добавить список используемой литературы?

При применении градиентных методов этот как раз выражается в частом застревании в локальных минимумах — это известная проблема
Finally, we prove that recovering the global minimum becomes harder as the network size increases and that it is in practice irrelevant as global minimum often leads to overfitting






















Обзор градиентных методов в задачах математической оптимизации