
Аналитика по скидке: когда клиенты готовы платить только впечатлениями
Если данные новая нефть, то почему за нее не готовы платить?
Как измерить ценность внедрения аналитики?
Облекаем данные в красивую оболочку
Аналитика по скидке: когда клиенты готовы платить только впечатлениями
Если данные новая нефть, то почему за нее не готовы платить?
Как измерить ценность внедрения аналитики?
Разбираемся как упаковывать данные в диаграмму Sankey, от этапа проектирования до сборки финальных кортежей.
Всем привет! Меня зовут Максим Шаланкин, и я веду несколько образовательных блоков в нашей школе аналитиков данных в МТС. Сегодня я хочу рассказать, как мы организовали необычное занятие по анализу данных: в нем студенты соревновались за звание лучшего в игре, напоминающей Tinder, но для графиков предварительного анализа (EDA). Эта активность не только помогла освоить ключевые навыки визуализации, но и сделала процесс обучения увлекательным и запоминающимся, демонстрируя практическую значимость качественного анализа данных.
В этом материале я расскажу, как мы вообще обучаем EDA, какие нюансы есть в процессе и как мы делаем его интересным с помощью игры. История и графики победителей под катом.
Как-то всем отделам дали задание: предоставить матрицы компетенций. Все поняли его по-своему. Я не был исключением. Речь пойдёт о том, зачем нужен более высокий уровень абстракции для матрицы компетенций, и как он называется?
Создание цветовых градиентов для дашбордов в Dash/Plotly
Проблема: при создании интерактивных дашбордов часто возникает сложность с автоматической цветовой разметкой категорий, количество которых может динамически меняться.
Решение: автор делится методом создания адаптивных цветовых схем‑градиентов, которые автоматически подстраиваются под количество категорий без ручного задания цветов.
В статье вы узнаете:
Как избежать проблем с ручным назначением цветов
Как предотвратить «заканчивание» заранее подготовленных цветовых палитр
Как создать равномерные цветовые градиенты в рамках заданной схемы
Практические примеры реализации на Plotly и Dash
Для кого: разработчики дашбордов, работающие с Plotly и Dash, которые хотят оптимизировать процесс визуализации категориальных данных.
Что внутри: готовые решения для автоматического создания цветовых градиентов, которые можно легко интегрировать в свои проекты.
Генерацию гипотез через дерево метрик считаю одним из самых результативных подходов. Особенно значимым для меня тут является возможность отделить личное мнение от принятия решений. Этакое «я нерепрезентативен» на максималках. Лично для меня это важно ещё и потому, что почти во всех продуктах, над которыми я работала, я сама не являлась core‑пользователем.
На сами метрики мы смотрим фактически с тремя задачами:
В крупных федеральных организациях всё активнее используется подход управления на основе данных, который требует активного использования и постоянной переделки, развития, модификации аналитических приложений, отчётов, данных. Тот опыт и наши наработки, которыми мы хотим поделиться в рамках данной статьи, приносят пользу на многих проектах, где речь идёт о сотнях аналитических отчётов и дэшбордов, нескольких тысячах показателей и сотнях и тысячах активных пользователей, где, самое главное, вендорские решения кастомизируются внутренними командами заказчика. Для таких случаев всё, о чём мы расскажем дальше, очень важно, для остальных — надеемся, что будут полезны отдельные мысли и технические решения.
Начнём с простого и наболевшего. Когда создаётся первая версия дэшборда, задача звучит просто: «показать данные хоть как-нибудь и побыстрее». Не до архитектуры, не до производительности — главное, чтобы цифры появились, и руководство смогло принять правильное управленческое решение. Потом уточняется задача, добавляются новые требования, меняются источники, добавляются разрезы данных, растёт нагрузка. И вот тот самый дэшборд, собранный на скорую руку, оказывается в проде — и технически работает не так и не с той скоростью, как нужно. А далее необходимо развивать функционал, обновлять версию. И сложности растут.
В этой статье команда авторов ГК Luxms, вендора платформы бизнес-аналитики Luxms BI, расскажет, почему так происходит и почему «оптимизация» — это не про критику, а про работу с реальностью, со сложной реальностью мира IT и мира данных. А еще — почему важно не только чинить, но и уважать чужой код.
📊 Информативные графики с двумя осями Y и тремя разными единицами измерения в Plotly!
В этом туториале я разберу, как с помощью мощной библиотеки Plotly на Python создать интерактивную визуализацию с тремя различными единицами измерения.
Вы узнаете:
• Как настроить вторичные оси Y и X
• Способы визуализации разнородных данных
• Техники форматирования шкал и меток
• Варианты красивого оформления мульти-осевых графиков
Всем доброго дня! Пишу здесь впервые. На написание меня этой статьи побудило желание рассказать людям об эффективном способе миграции от внутренней базы данных Sqlite3 к внешней БД PostgreSQL. Подобной статьи на Хабре я не нашел, поэтому надеюсь будет полезно.
Я всегда любила схемы и таблички. Если нужно было разобраться в новом проекте/топике/проблеме — я рисовала схему этого. Если нужно было принять решение — делала таблицу. Если я не могла положить что-то в один из этих форматов, значит, нужно было копать тему дальше. В Miro накопилось десятки рабочих пространств. И всегда хотелось сделать основную, самую главную схему для продуктовой команды, которая позволяла бы быстро и чётко возвращать всех к единой цели с единым пониманием — куда, зачем и как именно копаем. Дерево метрик — самый действенный инструмент, который мне попадался.
Что такое дерево метрик и зачем оно нужно?
Дерево метрик — это иерархическая структура, которая связывает бизнес-цель с подчинёнными метриками и действиями, помогая понять, какие показатели влияют на результат и где искать точки роста или проблемы.
Если просто: дерево метрик — это инструмент, который связывает:
Привет, Хабр! Меня зовут Александр Антипов, я продакт-оунер MWS Tables.
Раньше казалось, что «опытные пользователи ПК» — исчезающий вид, но реальность другая: сегодня сотрудники не просто работают с технологиями, а сами автоматизируют рутинные процессы. Без разработчиков и сложных систем — с помощью макросов, таблиц, SharePoint и других инструментов.
Полтора года назад мы в МТС создали для таких кейсов MWS Tables — внутреннюю платформу самостоятельной автоматизации. В этом посте — реальные примеры, как MWS Tables уже применяется на практике. Я покажу, как с помощью MWS Tables реализовали единый реестр для работы с качеством данных, централизованную систему по менеджменту IT-проектов и собственный таск-трекер. Все подробности — под катом.
На связи Анна Астахова, директор по развитию компании «Белый код». В конце ноября я принимала участие во II съезде Российской ассоциации аптечных сетей. Несколько раз там звучала мысль, что волшебная таблетка для аптек сегодня — это анализ данных. Важно видеть и считать коммерческие показатели. Иначе бизнес не сможет справиться с конкуренцией. В статье на примерах расскажу, чем аналитика может помочь аптечным сетям.
Привет, друзья! Сегодня поговорим о том, как системный аналитик (то есть я, ты или тот парень из соседнего отдела) может использовать визуализацию, чтобы перестать быть "человеком, который пишет непонятные документы", и стать "тем, кто делает красивые картинки, которые все понимают". Ну, или хотя бы пытается.
Давайте признаем, что иногда объяснить разработчику, как работает процесс, — это как объяснить котику, почему нельзя есть кактус. Ты вроде всё правильно говоришь, но в итоге он всё равно делает или понимает по-своему. А всё почему?
Первое - причина в нас! (но это уже отдельная история)
Второе- потому что слова — это скучно.
Во многих соревнованиях тема дополнительных показателей является достаточно острой, иногда даже холиварной. По-другому быть не может, ведь они выходят на сцену в самый драматичный момент, когда определяются судьбы кубков, медалей, а порой и карьер.
Есть, например, мнение, что если бы Саутгейт-игрок забил тот пенальти в 1996, то, возможно, стиль сборной Англии при Саутгейте-тренере был более смелым.
Конечно, основная тема для споров - это мера случайности различных доппоказателей, сама по себе или в сравнении с "настоящей игрой". В каждом виде соревнований эти показатели и споры об их случайности свои, тут сложно придумать какой-то универсальный ответ.
Я довольно много играю в спортивное "Что? Где? Когда?", поэтому хочу сделать заход в этой области.
Данный отчет представляет собой аналитическое исследование авиапроисшествий, произошедших в период с 2014 по 2024 годы и расследованных МАК. В основу анализа легли данные о происшествиях, включающие сведения о типах воздушных судов, числе погибших, географическом расположении инцидентов, а также причинах катастроф
Всем привет! Меня зовут Олег Косарев. Я – ведущий инженер-программист. В группе компаний «Цифра» занимаюсь развитием и поддержкой продукта «Диспетчер». Моя основная специализация – Frontend-разработка.
В данной статье я хочу поделиться с вами нашим опытом по созданию MVP (Minimum Viable Product, «минимально жизнеспособный продукт») редактора аналитических панелей.
Привет, Хабр! Мы уже неоднократно поднимали вопросы оптимизации запросов к СУБД ClickHouse, которую все чаще используют как универсальное высокопроизводительное хранилище для аналитических задач. В случае с Visiology этот вопрос приобретает двойную ценность, так как мы используем оптимизацию для эффективного выполнения запросов в языке DAX.
Сегодня мы поговорим о применении группировок GROUP BY
с учетом их производительности для относительно больших таблиц, например, с миллионами записей. Таким образом, речь пойдет об оценке кардинальности одного или нескольких столбцов. Эта задача, кстати, является достаточно нетривиальной. Но если Вы можете ее решить, появляется возможность для эффективных оптимизаций SQL. О них мы и поговорим сегодня.
Феномен Современного искусства с каждым днём приобретает новые, более широкие рамки и концепции. Но, их понимание и интерпретация для простого зрителя по-прежнему вызывает много вопросов.
Одними из ведущих факторов оценки искусства являются уникальность, сложность и, конечно же – стоимость.
Зачастую, совсем «простые» произведения имеют совсем не малую цену, величина которой порой, кажется, действительно несоизмерима с визуальной составляющей работ.
Наша команда решила разобраться с этим феноменом и провела исследование в области произведений современного искусства (делая особый акцент на изобразительном творчестве). Мы собрали статистические данные из открытых источников в интернете (с ресурсов, представляющих наибольших интерес у коллекционеров, покупателей, галеристов). На основании этих данных можно проследить аттрактивность предметов коллекционирования, их востребованность и ценность.
Среди всех вариантов расчета данных мы выбрали наиболее показательные поля для оценки: регион и год создания, стиль и тема искусства, площадь, ключевые слова, а также тип материала (из которого и на котором выполнено произведение).
Комбинация данных позволили выделить некоторое количество ведущих пунктов, ставших- основой для создания статистики.
Зависимость стоимости от региона (илл.1) показывает самые дорогостоящие произведения из Центральной Америки, цена которых варьируется от 3,5 до 4,8 млн. рублей. Следом за ними - произведения стоимостью от 500 тыс. до 1.5 млн. из Южной Азии и Западно-Африканского региона.
Ориентируются ли собаки по компасу, когда делают свои грязные дела? Оказывается — да! Если вам интересно, как можно это подтвердить в домашних условиях, используя компас, Байесовскую статистику и собаку (собака не включена), то добро пожаловать под кат.