Обновить
56.17

Визуализация данных *

Облекаем данные в красивую оболочку

Сначала показывать
Порог рейтинга
Уровень сложности

Self-Service в BI — зачем нужен, как работает и как реализован в Modus

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1K

При выборе BI-решений компании всё чаще обращают внимание на наличие инструментов самообслуживания (self-service). Идея проста: дать пользователям возможность самостоятельно решать аналитические задачи, экономя время и ресурсы. В этой статье мы расскажем, что такое self-service и как этот подход реализован в Modus BI.

Читать далее

МРТ для DataScience. Часть 6

Время на прочтение11 мин
Количество просмотров1.2K

Продолжаем изучать МРТ-данные с точки зрения Data Science. Сегодня поговорим о некоторых питоновских библиотеках для обработки МРТ-изображений и их метаданных: SimpleITK, PyDicom, PyNrrd, MONAI.

Содержание и первые части цикла статей здесь.

Читать далее

Экосистема для разработки и применения Computer Vision (CV) в промышленности

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров3.2K

В этой статье мы хотим поделиться опытом разработки экосистемы (если есть слово поудачнее, то обязательно поделитесь в комментариях) сервисов для упрощения процесса разработки моделей и решений по CV. Идея написать статью укрепилась после того как мы пообщались со специалистами из разных промышленных компаний и поняли, что опыт у всех довольно разный, а средний уровень зрелости еще не такой высокий.

В данной статье сделаем акцент не на получающиеся ML-модели, их интеграцию и бизнес кейсы, а на обычно скрытый от глаз процесс разработки решений с ML (и CV в частности) в промышленности.

Читать далее

Что будет, если каждый день отслеживать динамику своих метрик. Итоги месяца

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.6K

В статье про итоги эксперимента по отслеживанию своих показателей каждый день на протяжении 35 дней. И что будет, если попробовать относиться к себе как к продукту

С графиками 📈📊

Читать далее

Миграция BI-аналитики: как перейти на Apache Superset и не потерять пользователей

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.7K

Привет! Меня зовут Виталий Флёрин, я руководитель отдела BI-аналитики в M2. За год мы успешно перевели всю отчетность компании с Cognos Analytics на Apache Superset и увеличили MAU до 200 (каждый третий сотрудник компании). В статье хочу поделиться опытом внедрения новой системы отчетности и ее эффективного использования.

Материал будет полезен BI-специалистам, кто работает над развитием внутренних систем и хочет переехать на Superset.

История началась с того, что после ухода Cognos Analytics с российского рынка, нам нужно было выбрать новую BI для компании и мигрировать всю отчетность. Текущая система была развернута on-premises и продолжала работать в штатном режиме. Да, без обновлений и поддержки, но благодаря этому мы смогли тщательно подойти к выбору нового решения и обеспечить плавный переход пользователей на новую платформу.

Читать далее

Фракталы и бесконечность: 50 лет открытию Бенуа Мандельброта

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров7.1K

Наверное все хотя бы раз видели картинки с фракталами и примерно представляют себе, что это такое. Кажется, будто они были с нами всегда — тем удивительнее, что и самому слову, и его математической базе, и визуальному воплощению — всего лишь полвека. Рассказываем историю одного из самых удивительных (и красочных) математических открытий XX века.

Читать далее

Как интегрировать данные из Яндекс Бизнеса и Calltouch в Яндекс Метрику

Время на прочтение3 мин
Количество просмотров710

Мы столкнулись с тем, что клиенту нужно было видеть статистику расходов Яндекс Бизнес в Яндекс Метрике и отслеживать стоимость звонков по рекламным кампаниям.

Так же клиент хотел видеть простой и понятный дашборд с данными по расходам из кампаний Яндекс Бизнес и стоимостью целевого лида (звонок, переданный в отдел продаж). Дашборд должен был обновляться хотя бы раз в неделю.

Основная сложность в том, что данные по статистике рекламных кампаний ЯБ не доступны по API, но есть возможность выгрузки этой информации в excel-файл. Для того чтобы загрузить эту информацию в Я.Метрику мы воспользовались инструментом загрузки расходов через csv-файл.

Как мы это сделали по шагам:

Шаг 1. Выгрузили данные из рекламного кабинета. Подготовили на основе данных csv по инструкции. Загрузили данные в Я.Метрику.

Что помогло нам получить статистику по расходам внутри Я.Метрики. Теперь эти данные можно склеить с данными по звонкам.

Шаг 2. Сделали интеграцию коллтач и метрики на стороне коллтач

Теперь у нас есть статистика по звонкам в разрезе рекламных источников

Шаг 3. Создали дашборд в Я.Метрике на основе загруженных данных

Получили доступную, для понимания пользователя, статистику по конкретному рекламному каналу

В итоге менее чем за 1 рабочий день подготовили данные для дашборда и создали дашборд, отвечающий задаче клиента. Теперь клиент внутри интерфейса Я.Метрики получает информацию о расходах по рекламной кампании ЯБ и стоимости звонка с этого источника.

А так же подготовили инструкцию, как добавить расходы в Я.Метрику

Читать далее

Супер-простой анализ отзывов с помощью GPT

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров4.7K

Для менеджера по продукту отзывы пользователей – это бесценный источник знаний о проблемах, запросах, пожеланиях и юзкейсах аудитории. Но есть нюанс: анализировать текстовые отзывы вручную тяжело, поэтому команды часто их игнорируют целиком или анализируют отзывы редко и несистемно.

Мы решили упорядочить анализ и систематизацию отзывов пользователей с помощью GPT. В итоге получился полностью автоматизированный дашборд, который обновляется каждый день и приносит много пользы и инсайтов.

Читать далее

Self service в действии: как Luxms BI помогает ускорить аналитику

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров1.5K

В последние несколько лет мы все чаще слышим о self service подходе в BI, он становится всё более важным для бизнеса, предоставляя пользователям возможность самостоятельно анализировать данные и принимать решения без участия IT-служб. Self service BI предоставляет бизнес-пользователям гибкость и контроль над своими отчётами и дэшбордами, позволяя работать с данными без навыков программирования.

Мы в ГК Luxms, понимая этот запрос со стороны рынка, сделали значительный шаг в развитии self service функционала на нашей платформе Luxms BI. 

Luxms BI — платформа бизнес-аналитики данных с высочайшим быстродействием и горизонтальной масштабируемостью. У неё мощные функциональные и визуальные возможности, а также быстрая обработка больших объёмов данных благодаря своей датацентричной архитектуре. В Реестре российского ПО.

Сейчас многие крупные клиенты, такие как Почта России и Департамент здравоохранения Москвы, активно используют Luxms BI именно как полноценный инструмент для самостоятельного анализа данных. 

Меня зовут Алексей Розанов, я руководитель пресейл направления и работы с партнёрами, и в этой статье я расскажу, как мы целенаправленно работали над этим направлением и что уже сделали, чтобы сегодня наша платформа являлась мощным аналитическим решением для решения self service задач.

Читать далее

Boxplot, он же ящик с усами

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров16K

Представьте, что вам нужно быстро сравнить распределения зарплат сотрудников разных отделов или оценить разброс результатов эксперимента. В таких ситуациях отличным выбором будет boxplot, он же “ящик с усами” – эффективный инструмент для выявления ключевых характеристик распределения, позволяющий быстро оценить медиану, разброс данных и обнаружить выбросы.

В этой статье мы подробно разберем, что такое boxplot и почему его называют “ящиком с усами”.

Читать далее

Использование PyGame для визуализации сигналов звукового диапазона с частотой дискретизации 44100 Гц в реальном времени

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров2.5K

PyGame — это популярная библиотека для разработки 2D игр на Python. В данной статье рассмотрено необычное применение PyGame – это быстрый вывод графиков, например, потоков данных с частотой дискретизации 44100 Гц со звуковой карты, что может быть применимо для визуализации звуковых сигналов.

Читать далее

Новый инструмент для обучающих программ: зачем мы превратили прогресс продуктовых команд в котировки на игровой бирже?

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров963

Меня зовут Александра, и я — менеджер инкубатора Коллаб 2К24 от ВкусВилла. В 2024 году мы запустили программу, в рамках которой студенты — бакалавры и магистры ведущих ВУЗов России и СНГ разрабатывали свой инновационный продукт. Чтобы команды налаживали горизонтальные связи, делились опытом, получали качественную обратную связь от конкурентов и радовались успехам друг друга —  мы создали модель биржи ценных бумаг внутри нашего R&D Инкубатора. Это совершенно новый подход к акселерационным программам, который можно адаптировать и запустить под любой формат: корпоративная программа, учебный курс или стартап-акселератор. 

Читать далее

Мнение GlowByte: чем можно импортозаместить CPM и надо ли это делать

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров708

Всем привет! Это снова мы — направление FI (Financial Intelligence) компании GlowByte. В прошлой статье мы обещали рассказать про отечественные решения класса CPM. Сегодня мы расскажем, почему, на наш взгляд, сейчас лучшее время для внедрения российского софта, а также опишем основные требования заказчиков к подобным платформам. 

Читать далее

Ближайшие события

Python 2D графика. Визуализация данных в реальном времени. Matplotlib, PyQTGraph, pyOpenGL, VisPy, Bokeh и др. FPS 200?

Уровень сложностиСложный
Время на прочтение4 мин
Количество просмотров10K

Тестирование на скорость рисования 2D графиков и измерение fps популярных графических пакетов (Mayavi 3D, PyVista, Matplotlib, PyQTGraph, Plotly, PyGame, Arcade, pyOpenGL, VisPy, Bokeh) Возможно ли на слабом железе получить FPS=50? А FPS=1000? Да, но есть нюансы: VSync=Off

Для 8 графических пакетов в статье приведены 8 максимально коротких и простых специфичных для каждого пакета кода на python, отображающий на экране с максимально возможным FPS для данного пакета график sin()+noise.

Читать далее

Плюсы и минусы SUMMARIZE

Время на прочтение6 мин
Количество просмотров2.5K

При использовании DAX аналитикам важно следить не только за корректностью результатов, но и за производительностью системы при обработке запросов. Одним из инструментов повышения эффективности является корректное использование функции SUMMARIZE. Всем, кто работает с большими объемами данных, активно изучает синтаксис DAX, а также интересующимся особенностями SUMMARIZE — добро пожаловать под кат!

Читать далее

Digital Twin. Часть 1. Цифровой двойник vs цифровой самозванец

Время на прочтение27 мин
Количество просмотров4.9K

Сегодня распространённым (модным) явлением стало называть «старое» моделирование новым термином «Производство цифровых двойников» (Digital Twin), тем самым создавая туман-интригу, при котором соблазн монетизации пафосного бренда и хайп вокруг Цифрового двойника побеждают здравый смысл. За редким исключением все, что сейчас называют Цифровой трансформацией и Цифровым двойником – по сути ими не являются, отсюда и желание разобраться в термине «цифровой двойник». Первый шаг на пути «от путаницы к ясности» - это определиться с терминологий. Так необходимым условием идентификации Digital Twin предлагается считать наличие трех раздельных компонентов (два близнеца и связь между ними) и адекватность модели (точность, т.е. «as-really-is», и требуемая детализация).

По тексту приведены в основном цитаты из [DTatom20] / [DTatom19min] и [Dozortsev22] / [Dozortsev23]. Однако эти и подобные исследования (вкл. [Pavlov23]) носят описательный (обзорный) характер, а хороших (внятных) классификаций, концепций и framework для DT не встречал. Вообще, по DT информации – тьма, но после прочтения хотя бы указанных книжек и ссылок становится вопросов только больше.

Пока что красивая метафора «Цифровой двойник» \ Digital Twin (ЦД \ DT) имеет скупую концептуальную проработку: требуется даже не уточнение концепции, а скорее ее формирование, т.к. это пока только аморфная и противоречивая парадигма, точнее множество парадигм DT/ Pseudo DT, в которых называют одним именем (DT) разные вещи (размытие концепции). По большому счету сегодня имеем только концепт Майкла Гривса и массу «маркетинговых оберток», которые не соответствуют даже его концепту 2002 года. Попытки концептуализации, классификации, разработки таксономий хоть и проводятся, например, [Archetypes], но пока они не очень результативны.

Читать далее

Поддержка MDX в Luxms BI: комфортная миграция с Power BI

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров810

Сегодня у большинства крупных компаний есть схожая задача: в условиях санкционных рисков, постепенном «отключении» зарубежных систем и политики импортозамещения перейти на отечественные решения, сохраняя при этом функционал, привычное качество решений и свои наработки.

Меня зовут Алексей Розанов, я руководитель пресейл направления и работы с партнерами ГК Luxms, вендора платформы Luxms BI.

Luxms BI — платформа бизнес-аналитики данных с высочайшим быстродействием и горизонтальной масштабируемостью. У нее мощные функциональные и визуальные возможности, а также быстрая обработка больших объемов данных благодаря своей датацентричной архитектуре. В Реестре российского ПО.

И как человек, который постоянно общается с заказчиками, я прекрасно понимаю, насколько сложным может быть переход с одной системы бизнес-аналитики на другую. Перенос данных, настройка ETL-процессов, интеграция с текущими бизнес-процессами, полная перестройка работы ИТ-служб — всё это требует значительных усилий. А для тех, кто использует Power BI и работает с многомерными кубами, задача усложняется многократно.

В этой статье я расскажу, как Luxms BI помогает нашим клиентам успешно адаптироваться к новым условиям, не теряя в гибкости и эффективности аналитики на примере реализации поддержки MDX-запросов.

Читать далее

Juniper и Cisco, как правильно собрать syslog и красиво оформить dashboard в grafana

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров5.4K

В данное статье рассматривается порядок развертывания системы сбора и анализа логов с сетевых устройств производства Cisco и Juniper Networks, посредством применения «Syslog-ng», «Vector», «Loki» и «Grafana». Подробно описан процесс развертывания данных инструментов с помощью docker‑compose. Помимо этого, в статье затрагивается конфигурация сетевых устройств с использованием Ansible. Отдельное внимание отведено визуализации данных в Grafana, посредством создания dashboard.

Читать далее

Логика построения BI-приложения. Методология DAR для проектирования дашбордов

Время на прочтение5 мин
Количество просмотров3.7K

В BI-системах визуализации объединяются в листы, а несколько листов, отражающих конкретную предметную область, называются аналитическим приложением.

Структура приложения может как упростить восприятие данных, позволяя быстро находить нужную информацию, так и усложнить процесс анализа, если приложение построено хаотично.

В этой статье рассказываем о методологии DAR для разработки аналитического приложения на основе дедуктивного способа познания.

Читать далее

Как данные о ДТП превратить в арт-проект

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.1K

Этот проект — моя попытка привлечь внимание к проблеме смертности в дорожно-транспортных происшествиях в Европе. Через визуализацию данных я старалась показать, насколько остро стоит эта проблема, и подчеркнуть, что многие жизни можно было бы спасти благодаря грамотному городскому планированию и мерам безопасности.

Проект оказался очень личным для меня, поскольку тема смертности в ДТП в нашей стране остаётся в тени, несмотря на её актуальность. Через искусство, основанное на данных (data art), я хотела не только привлечь внимание к этой теме, но и поделиться лучшими мировыми практиками.

Читать далее