Как стать автором
Обновить
18
0
Дмитрий Ширшаков @Shirshakov

BigData, аналитика, ML

Отправить сообщение
Предположу, что вы говорите о разных вещах.
Ваша компания разрабатывает продукт для других? В статье же речь идёт о программистах в штате и доступе до своего боя. Как минимум, read-only на реплике можно попробовать организовать.
Но СБ решила иначе, чем усложняет отладку и скорость разработки в целом. Хорошо ли это в целом для компании — вопрос.
Во-первых, чем больше деперсонализированных данных, тем больше вероятность сделать их персонализированными. При должном умении и настойчивости. Например, собирая все факты о контрагенте X.

Во-вторых, ценными являемся не только персональные данные, но и суммы денег, количество штук, например. Перемешивание же этих данных может привести к неконсистентности базы или как минимум неповторяемости проблемы прода на созданной копии.
Ставил я, давненько, СКД по отпечаткам на одном заводе. Так у одного заводчанина не читались отпечатки, он с карбидом ежедневно работал.
C 2016. Вы же про sp_execute_external_script?
В 2017 ещё Python добавили аналогично.

В целом, это не противоречит тексту статьи: из RStudio обращаться к MS SQL — это одно. А запускать готовые отлаженные R-скрипты внутри MS SQL — это немного другое.
Расскажите, пожалуйста, почему вы используете ПК-версию? Online-версия всегда под рукой, поисковой движок куда мощнее и данные самые оперативные.
Для нашей задачи кусочно-линейного тренда достаточно. Экспоненты там не бывает, т.к. число жителей города (потенциальных пользователей) ограничено. Плюс мы регулярно всё пересчитываем, чтобы учесть свежие данные.
Относительные метрики — идея в целом не плохая. Но крупные сферы деятельности (общепит, супермаркеты, парикмахерские) сведут на нет сезонности в узких сферах. В них дельта станет на уровне статистической погрешности.
График №7 показывает, что нет :)
Обратите внимание, пользователей интересуют бетон, ЖБИ, кровля и ландшафтная архитектура на месяц раньше, чем товароведы в компаниях начинают заниматься продвижением своей продукции.

Информация

В рейтинге
Не участвует
Откуда
Новосибирск, Новосибирская обл., Россия
Работает в
Дата рождения
Зарегистрирован
Активность

Специализация

Product Manager, Data Engineer
Lead