Не демонизируйте AnchorModel. На момент выбора якорной модели она неплохо себя показывала. Тогда компания переезжала с монолита на микросервисы, поэтому максимальная гибкость была очень кстати. Архитектура хранилища существует не в вакууме, а в инфраструктуре компании. И если окружение меняется, то меняется и архитектура хранилища.
а инцидент мая 2024 на DWH и ETL обвязку как-то повлиял?
Предположу, что вы говорите о разных вещах.
Ваша компания разрабатывает продукт для других? В статье же речь идёт о программистах в штате и доступе до своего боя. Как минимум, read-only на реплике можно попробовать организовать.
Но СБ решила иначе, чем усложняет отладку и скорость разработки в целом. Хорошо ли это в целом для компании — вопрос.
Во-первых, чем больше деперсонализированных данных, тем больше вероятность сделать их персонализированными. При должном умении и настойчивости. Например, собирая все факты о контрагенте X.
Во-вторых, ценными являемся не только персональные данные, но и суммы денег, количество штук, например. Перемешивание же этих данных может привести к неконсистентности базы или как минимум неповторяемости проблемы прода на созданной копии.
C 2016. Вы же про sp_execute_external_script?
В 2017 ещё Python добавили аналогично.
В целом, это не противоречит тексту статьи: из RStudio обращаться к MS SQL — это одно. А запускать готовые отлаженные R-скрипты внутри MS SQL — это немного другое.
Для нашей задачи кусочно-линейного тренда достаточно. Экспоненты там не бывает, т.к. число жителей города (потенциальных пользователей) ограничено. Плюс мы регулярно всё пересчитываем, чтобы учесть свежие данные.
Относительные метрики — идея в целом не плохая. Но крупные сферы деятельности (общепит, супермаркеты, парикмахерские) сведут на нет сезонности в узких сферах. В них дельта станет на уровне статистической погрешности.
График №7 показывает, что нет :)
Обратите внимание, пользователей интересуют бетон, ЖБИ, кровля и ландшафтная архитектура на месяц раньше, чем товароведы в компаниях начинают заниматься продвижением своей продукции.
Не демонизируйте AnchorModel. На момент выбора якорной модели она неплохо себя показывала. Тогда компания переезжала с монолита на микросервисы, поэтому максимальная гибкость была очень кстати.
Архитектура хранилища существует не в вакууме, а в инфраструктуре компании. И если окружение меняется, то меняется и архитектура хранилища.
Нет, не повлиял. Только немного подвинул сроки.
Ваша компания разрабатывает продукт для других? В статье же речь идёт о программистах в штате и доступе до своего боя. Как минимум, read-only на реплике можно попробовать организовать.
Но СБ решила иначе, чем усложняет отладку и скорость разработки в целом. Хорошо ли это в целом для компании — вопрос.
Во-вторых, ценными являемся не только персональные данные, но и суммы денег, количество штук, например. Перемешивание же этих данных может привести к неконсистентности базы или как минимум неповторяемости проблемы прода на созданной копии.
В 2017 ещё Python добавили аналогично.
В целом, это не противоречит тексту статьи: из RStudio обращаться к MS SQL — это одно. А запускать готовые отлаженные R-скрипты внутри MS SQL — это немного другое.
Умеют. Не везде, правда.
Относительные метрики — идея в целом не плохая. Но крупные сферы деятельности (общепит, супермаркеты, парикмахерские) сведут на нет сезонности в узких сферах. В них дельта станет на уровне статистической погрешности.
Обратите внимание, пользователей интересуют бетон, ЖБИ, кровля и ландшафтная архитектура на месяц раньше, чем товароведы в компаниях начинают заниматься продвижением своей продукции.