Comments / Profile of KainoRhine / Habr

Вильмов Андрей @KainoRhine

Программист(SQL, PHP, Python, ML), Аналитик данных

Profile Publications 3Comments 5Bookmarks

У нас на триггерах запускаются бизнес-процессы, которые должны отрабатывать сразу, как только запись появляется (insert), изменяется (update) или удаляется (delete). Ранее все это работало в MSSQL, и триггеры висели на таблицах. Однако со временем таких триггеров стало очень много, и помимо обновления данных в базе нам нужно было отправлять еще и различные уведомления по почте, в Telegram и WhatsApp. Поэтому со временем база стала работать медленнее, так как мы ждали, пока отработают все триггеры при каждой нашей транзакции insert/update/delete. Поэтому мы и сделали такую систему.

Look

Прогнозирование продаж Python. Как находить и сглаживать выбросы с помощью фильтра Хэмплея

KainoRhine Feb 6 2023 at 17:26

Да, вы правы, я допустил ошибку в статье, сказав что очищаем временный ряд. Мы очищаем выборку от аномалий, пропусков и битых данных.

Look

Прогнозирование продаж Python. Как находить и сглаживать выбросы с помощью фильтра Хэмплея

KainoRhine Feb 6 2023 at 16:30

Мы прогнозируем временные ряды. И для прогноза используем сглаженные данные (так, как в данных есть аномалии, либо продажи которые более не повторяться). Да, мы сглаживаем не все, например есть всплески в продажах, которые вызваны рекламными акциями или открытием нового филиала, такие данные мы не сглаживаем и не убираем. Но по итогу, моделька прогнозирует кол-во отгрузок со склада, с точностью 91,8% (по самым ходовым товарам). Да, если вдруг придет сейчас продажа например на 30 000 единиц товара, то модель ее не спрогнозирует. Но такие КП бывают редко. Со всем остальным это алгоритм справляется. Например на прошлой неделе должно было уйти 2877 единиц товара, а ушло по факту 2836 единиц.

Да, про сезонность и тренд автор знает) + мы для прогнозирования используем логику: построения тренда и сезонности (через ариму/профет (тут для примера)), а потом загоняем эти данные в бустинг, который уточняет прогноз первой модели.

Look

Прогнозирование продаж Python. Как находить и сглаживать выбросы с помощью фильтра Хэмплея

KainoRhine Dec 3 2022 at 18:07

Да увидел
Там такая строка будет: r_mad = k * np.median(np.abs(y[(i - window_size):(i + window_size)] - r_median))

-1

Look

Прогнозирование продаж Python. Как находить и сглаживать выбросы с помощью фильтра Хэмплея

KainoRhine Dec 3 2022 at 13:55

Да, совершенно верно. Однако, в тех данных с которыми работаем мы, продажи на очень большие суммы (либо на очень маленькие) являются выбросами.
Например, товар X в неделю в среднем отгружается на 150 т.р. а сегодня он ушёл со склада на сумму 1 500 000 рублей. Это явно выброс. Так как такие отгрузки, в силу специфичности бизнеса, очень редки.
Более подробно расскажу в статье, где мы на рабочих (реальных) данных будем строить модель прогнозирования продаж

-1

Look

Information

Specialization