Михаил Калякин@AkaMikhelson
Директор по данным / Chief Data Officer
Информация
- В рейтинге
- Не участвует
- Дата рождения
- Зарегистрирован
- Активность
Специализация
Аналитик по данным, Chief Data Officer
Ведущий
От 2 000 000 ₽
SQL
DWH
BI
Анализ данных
Python
Git
Ок. Принято.)
Нельзя просто взять и встраивать.))
Кажется, так и прорастает зоопарк систем с непонятными доступами, неактуальным контентом и отсутствием ответственных за сопровождение.
Нужно выбрать решение для BI - может быть полезно запросить консультацию у крупных и опытных интеграторов. )
Работаю со стороны аналитики как с "маломальскими васянскими" конторами, так и с крупными игроками. Одного понимания что нужно мало. Важно понимание как это должно работать. К примеру, ваше предположение о "как минимум пайплайне" могу оспорить )
На мой субъективный взгляд, разработчиков подключают к аналитическим задачам в режиме "временного решения" просто потому что в компании нет экспертизы в работе с данными. Ну и временное быстро становится постоянным.
Статья выглядит как взгляд изнутри от разработчика. Хорошая рефлексия, полезные мысли!)
Нууу..хорошая практика - не менять данные на источнике.
Реплицируем-копируем-грузим, а меняем в отдельной аналитической области.
Если хочется что-то менять для аналитики, это подход с доступом в прод. Удачных кейсов не встречал )
Привет, Савелий!
Статья интересная. После прочтения понимаю, что сделать полноценную замену аналитику для получения ответов на ad-hoc запросов может быть трудной и даже не решаемой.
Как понимаю, у решения задачи, за которую Вы принялись, есть как преимущество - можно запрашивать действительно любые расчеты, а не только то, что уже считали; так и недостатки - помимо тех, что упомянули в статье, нет гарантии что два раза на один и тот же запрос вернутся одинаковые данные. А ещё, если вы предоставляете пользователю удобный интерфейс для ad-hoc, надо ожидать, что количество запросов возрастёт и даже если сами запросы будут предельно оптимальны, есть риск того, что узким горлышком станет производительность системы.
Что скажете?
Что за pro версия? ) PBI server бывает сейчас облачный и on-premise. И у on-premise есть варианты бесплатного использования с перестановкой раз в пол года.
Привет, Алина!
Спасибо за материалы.
В первый раз встретился с таким понятием как Feature platform.
Как понимаю, Feature platform - это возможная надстройка со своим набором метаданных о метриках/атрибутах (фичах) отдельных бизнес-сущностей.
Поделитесь, пожалуйста, правильно понимаю, что сейчас в Домклик Feature platform и DWH дивизиона развиваются параллельно? Если так, как поддерживаете консистентность и согласованность расчётов?
Привет, Александр!
А какова цель статьи?
Я надеялся на что-то вроде кейса с выбором BI. По факту в статье очень поверхностное понимание работы BI-систем, излишние, вводящие в заблуждение обобщения, крайне субъективные описания преимуществ отдельных платформ.
Лучше бы такого не писать, уж простите )
Алексей, доброго дня!
Интересная статья. Помогите понять - в чём преимущество создания чата, разобранного в статье, перед использованием готового чата с LLM, например, с deepseek? Кажется, и код доработать чат "из коробки" может и проанализировать логи, если направить логи
Привет, автор!
Интересная тема. Подскажите, пожалуйста, а в чём видите проблему - невозможно автоматизировать получение данных, а люди, даже опытные, допускают ошибки при вводе и обработке информации или задача обработки информации для полноценного финансового учёта без коробочных решений сама по себе сложна? Или есть что-то иное?
Привет!
Выходит, что data-аналитик - это специалист без критического мышления, а data-scientist - это как бы ml-инженер + data-аналитик?)
Возможно, стоит добавить в знания и навыки data-engineer и ml-engineer знание популярных оркестраторов, подходов к построению и методы оптимизации пайплайнов данных, технологии захвата изменений, модели хранения данных, особенности и преимущества использования популярных СУБД.
Привет, автор!)
Не уловил сути преимущества работы с таблицами в PIX BI перед Excel.
Сам с PIX не работал.
Уточните, пожалуйста
>> Когда .. исследователь, сидящий в каждом аналитике, топает ногами и требует расширения контроля над данными, — вот тут и начинается наше путешествие в мир BI-систем.
>>Да, работать с таблицами в self-service системах, таких как PIX BI, удобнее, чем в Excel. Почему? Во-первых, это просто. Все элементы интерфейса интуитивно понятны. Не нужно фантазировать с формулами или изображать из себя мега-специалиста..
>>Во-вторых, BI-системы предлагают интерактивность: можно легко настраивать фильтры, сортировки и даже комбинировать данные без риска испортить всю таблицу
А Вы точно продюсер?)
Не понял как интуитивно-понятные элементы и интерактивность расширяют контроль над данными и почему Вы считаете, что Excel так не умеет?)
Благодарю за обратную связь.)
Привет!
Мне будет полезно, если Вы укажете что конкретно трудно читается.
Абзац-предложение-мысль?
Привет!
>>Это интересная точка зрения, что аналитик на отвечает за бизнес-импакт, но хочет получать в форме зарплаты часть бизнес результатов компании.
Вот тут тонкая грань.
Если Вы про то, что "влияет ли аналитик на бизнес-импакт"? Конечно да. Даже сотрудник клининга влияет.
Тут я хотел определить то, на что у аналитика есть прямое влияние.
Моя практика показывает, что любая аналитика и статистика без применения управленцем в работе бесполезна. А Вы как считаете?
Привет!
Спасибо за попытку ответа.
Под контекст статьи не подходит.
Привет!
Хорошо, что Вы спросили.
>>Проблемы данных понимаю - это когда данных или нет, или они кривые. А проблемы на данных это что?
Пример проблемы на данных: если из данных следует что 5% остатков на складе регулярно списывают и это прямые издержки компании; если на данных видим, что раздали 100k$ по реферальной программе, а рефералы сделали доп.выручки только на 1k$.
Выглядит как проблема? Проблема, потому что у компании есть явные потери.
А на деле может оказаться что 5% не списывают а технично переносят на другой учёт и с остатками всё в порядке.
И 100k$, которые раздали - это тоже нормально, потому что раздали только за 10% рефералов, а 90% не оплачивали из-за специфики акции и, в целом, все 100% рефералов принесли 200k$.
А теперь потерь нет.
Привет, дорогой коллега!
Да, то, о чём Вы пишете - не редкость в работе аналитика в проектах-командах с низким уровнем грамотности / культуры работы с данными. Ситуация меняется на рынке РФ.)
Привет!
Не могу согласиться.
С 1с можно работать из компилятора вроде dbeaver. Под 1С фреймворком либо mssql либо pgsql. Подключайтесь и работайте.
Из 1с даже стримить можно отдельные объекты в нужные вам приемники. Посмотрите в сторону dbr от softpoint
Привет!
Плюсую предыдущему комментатору.
Аргументы из примера автора:
"Зачем нужен ваш BI, ведь все данные вы берете из 1С, можно же там и отчеты написать " , -
легко отбиваются тем, что 1С-разработка не готовы поддерживать в актуальном состоянии код для отчётности по двум простым причинам:
- им это не надо - платят им за другое
- они не могут знать как правильно считать/преобразовывать цифры, т.к. даже владельцы продуктов редко знают как нужно считать то, что им нужно считать