Алгоритмы *

Все об алгоритмах

СтатьиПостыНовостиАвторыКомпании

deliveryman 14 окт в 10:00

Как перестать верить в сказки и начать доставлять вовремя?

Простой

3 мин

4.5K

Алгоритмы * Исследования и прогнозы в IT * Математика * Разработка под e-commerce * Транспорт

Кейс

Всем привет. Меня зовут Денис, и я руковожу продуктами доставки. Сегодня я хочу рассказать вам об одной из самых больных тем в нашем деле — о вранье со сроками доставки.

Реальность достаточна горькая: постоянные опоздания бьют по деньгам, изматывают нервы и безвозвратно губят репутацию. В этой статье я расскажу как я с этим боролся и каким результатам мне удалось прийти

Как доставлять вовремя

trifonovstd 14 окт в 08:00

Предобусловливание и импульс в оптимизации: взгляд на алгоритмы PHB/PN от исследователей Яндекса

15 мин

5.3K

Блог компании ЯндексМашинное обучение * Искусственный интеллектАлгоритмы *

Современные задачи оптимизации в машинном обучении часто оказываются плохо обусловленными — грубо говоря, их ландшафт имеет долины с резко различающейся кривизной. В таких случаях методы на основе градиентного спуска сходятся медленно: шаг, выбранный для устойчивости на одном участке, оказывается слишком малым на другом.

Для ускорения сходимости широко применяются методы с механизмом импульса (momentum): классический метод Поляка — Heavy Ball (HB) — и метод Нестерова (ускоренный градиент). Оба эти метода используют идею накапливать «инерцию» градиента, благодаря чему могут двигаться по направлению оптимума быстрее обычного градиентного спуска.

Однако, хотя импульс позволяет ускорить алгоритм, сам по себе он не решает проблему плохой обусловленности функции. В таких ситуациях на помощь приходит предобусловливание — масштабирование шагов оптимизации по разным координатам на основе дополнительной информации о функции, чтобы выровнять скорость сходимости по различным направлениям задачи.

Всем привет! Меня зовут Степан Трифонов, я аналитик‑разработчик в Яндекс Пэй. Недавно мы с коллегами, Леонидом Левиным и Савелием Чежеговым, опубликовали научную статью Incorporating Preconditioning into Accelerated Approaches: Theoretical Guarantees and Practical Improvement, где ввели предобусловленные версии классических ускоренных методов — Preconditioned Heavy Ball (PHB) и Preconditioned Nesterov (PN) — и доказали для них оценки сходимости при весьма общих допущениях на предобусловливающую матрицу. Также мы провели численные эксперименты, которые продемонстрировали практический выигрыш новых алгоритмов по сравнению с обычными (непредобусловленными) методами HB и Нестерова.