Обновить
45.54

Визуализация данных *

Облекаем данные в красивую оболочку

Сначала показывать
Порог рейтинга
Уровень сложности

Обзор наиболее интересных нововведений из майского обновления Power BI

Время на прочтение4 мин
Охват и читатели6.7K
В этой заметке мы бы хотели поговорить о новых функциях в Power BI Desktop, которые включают в себя усовершенствование синхронизации слайсеров (фильтров), использование всех полей и мер для просверливания в отчётах.
Читать дальше →

Нахождение числа комиссий, «рисовавших» целые значения явки на президентских выборах РФ 2018 года

Время на прочтение7 мин
Охват и читатели42K
Графики с необычными пиками мы теперь видим после каждых федеральных выборов. Впервые в массы они вышли после выборов в 2011 году, когда люди и увидели фальсификации, и ознакомились в целом с анализом данных по выборам и с проблемой целочисленного деления в частности.

У распределений даже стали появляться свои имена. Это и «борода Чурова» для выборов 2011, и «пик Володина» для знаменитых 62.2% в Саратове. Поскольку до сих пор даже на хабре появляются статьи, не знакомые с решением проблемы целочисленного деления и не согласные "добавлять мусор" небольшой случайной добавки в данные, давайте посмотрим на результаты совсем иначе. Мы зайдём к построению графиков с противоположной стороны, где проблемы целочисленного деления вообще нет. И тоже увидим пики на целых значениях.


Читать дальше →

Разработка своего плагина визуализации для Grafana

Время на прочтение3 мин
Охват и читатели13K


Grafana — удобный инструмент для визуализации и мониторинга временных данных из множества источников. В этом посте я хочу рассказать ключевые концепции разработки своего плагина.

Создание своего плагина может понадобиться для 1) визуализации временных данных, т.к графановский движок удобен для создания запросов. 2) для расширения функциональности графаны под свои нужды.

Установка


  • Скачиваем и запускаем Grafana любым способом
  • После запуска через bin/grafana-server должна появиться папка data

Что такое плагин c тех. точки зрения


Эти детали знать необязательно. Я разбирался с этими концепциями по ходу дела.
Grafana 5.x — это большое приложение Angular версии 1.6.6 :) и немного React. Сам плагин — это angular controller, который лежит в файле data/plugins/your-module/dist/module.js, который может быть загружен как SystemJS модуль. Рядом должен быть файл plugin.json c мета-описанием плагина: название, id, иконки ...

Q & A Explorer. Апрельская функция для Power BI Desktop

Время на прочтение4 мин
Охват и читатели2.8K

Расширение возможностей функции «Вопрос ответ»


Сегодня мы бы хотели подробнее разобрать апрельское обновление PBI Desktop. В обновлённой версии PBI Desktop появляется возможность добавления на страницу отчёта специального окна, где возможно использовать функцию «Вопрос-Ответ» (Q&A Explorer). Данная функция позволяет пользователям задавать интересующие их вопросы по данным, находясь на странице отчёта. Для запуска данной функции необходимо настроить специальную кнопку Q&A Explorer.
Читать дальше →

Пишем свой источник данных для Grafana

Время на прочтение8 мин
Охват и читатели22K
Обычно, для отображения информации с веб-сервера данные загружают в систему мониторинга, а затем передают в Grafana. О том, как сделать это напрямую и о некоторых нюансах на пути к цели — под катом.


Читать дальше →

Дурилка картонная. Цифровая

Время на прочтение9 мин
Охват и читатели8.2K

Первый


– Продажи – по продуктам, по регионам, по клиентам. Приход денег. – Первый зачитывал заголовки отчетов на распечатках, и по одной передавал мне.

– Приход денег в той же аналитике? – с умным видом спросил я.

– А ты можешь приход денег по продуктам посчитать? – на лице Первого расплылась улыбка.

– Хм… Нет, вообще-то. Да, тупанул. – мне стало немного не по себе. Ну его, лучше молчать буду.

– Вот-вот. Дальше – приход и расход денег по статьям. Маржинальная прибыль, без налогов и косвенных, только транспортные оставь и менеджерские проценты. По продуктам, клиентам, регионам. Все вроде. – Первый передал мне последнюю бумажку, сложил руки на столе и уставился на меня.

– Все? Раз, два, три, четыре. Четыре отчета? Больше ничего не надо?

– А что еще надо? Вроде этого достаточно для контроля ситуации. Остальное – если потребуется, предоставят экономисты и бухгалтерия. – Первый говорил спокойно и уверенно.
Читать дальше →

Сегментация томографических данных

Время на прочтение23 мин
Охват и читатели10K


Зачем это нужно


Для чего выполняется томографическое исследование? В большинстве случаев ради медицинской диагностики, иногда — в научных целях. Цель медицинской диагностики — выявить патологию, либо получить о ней дополнительную информацию, либо же убедиться, что её нет. Каким образом это достигается? В большинстве случаев путем последовательного ручного анализа срезов, сгенерированных томографом. Зачастую этого вполне достаточно. Но в некоторых случаях получить достаточно информации только на основе анализа плоских срезов невозможно или картина получается неполной: например, при поиске патологий сосудов или анализе некоторых переломов. Также, иногда необходима информация о взаимном расположении различных органов: особенно это актуально при планировании предстоящих операций. Получить такую информацию только на основе плоских срезов, в большинстве случаев, затруднительно. Тогда приходит на помощь трехмерная реконструкция томографических данных.
Читать дальше →

Дашборды Check Point — вот что я люблю

Время на прочтение5 мин
Охват и читатели11K

— Зачем вы мне втираете про удобный интерфейс? Это вообще не важно. Меня интересует только функционал! (из беседы с клиентом)

При выборе NGFW (или UTM) чаще всего смотрят исключительно на функционал устройства. С этим подходом трудно поспорить (да и не нужно). Устройство безопасности в первую очередь должно защищать! При этом очень важно количество и качество механизмов защиты! Именно для этого публикуются различные отчеты Gartner и NSS Labs. Однако, еще одним важным аспектом любого NGFW является встроенная отчетность и качество ее визуализации. Ниже я попытаюсь рассказать почему это важно и почему Check Point в этом реально крут.
Читать дальше →

Визуализация в САПР: зачем мы написали еще один 3D-движок и как он работает

Время на прочтение11 мин
Охват и читатели9.3K
Команда C3D Labs с 1995 года делает геометрическое ядро, ключевой технологический компонент для создания систем автоматизированного проектирования (САПР). Два года назад мы выпустили собственный модуль визуализации C3D Vision. Зачем понадобился еще один 3D-движок?

image
Читать дальше →

Как подружить React и D3

Время на прочтение8 мин
Охват и читатели26K

D3 одна из наиболее популярных javascript-библиотек для создания динамических и интерактивных визуализаций данных. Сегодня ее используют сотни тысяч сайтов и web-приложений.


В интернете огромное количество примеров – от банальных линейных графиков до динамически обновляющихся диаграмм Вороного – созданных с помощью этой библиотеки. Кажется, что можно найти готовый код для любой самой причудливой визуализации и лишь немного модифицировать его «под себя».


Однако, интеграция D3 в web-приложение, построенное на React, на практике оказывается не самой простой задачей.


Читать дальше →

Mail.Ru Group на пятом московском Data Fest

Время на прочтение3 мин
Охват и читатели2.6K
image

Друзья, до самого долгожданного события года в сфере data science остался 1 день! 28 апреля состоится пятый московский Data Fest. Под катом наш рассказ о докладах и активностях Mail.Ru Group на конференции.
Читать о докладах и активностях

Квест по устранению аритмии сердца

Время на прочтение7 мин
Охват и читатели14K
image

Привет, Хабр! Сегодня предлагаем отправиться в увлекательное путешествие в самое сердце человеческого организма (в буквальном смысле этого слова), чтобы узнать как находят и обезвреживают источники аритмии.
Осторожно: трафик

Data Fest 2018: анонс и регистрация

Время на прочтение4 мин
Охват и читатели6.4K
image

Друзья, приглашаем вас на пятый московский Data Fest, который состоится 28 апреля на территории дизайн-завода FLACON. Data Fest — крупнейшая бесплатная конференция для исследователей, инженеров и разработчиков, связанных с машинным обучением, анализом и обработкой данных, а также тем, что пресса любит называть AI.

Вы узнаете про AI в продуктах Mail.Ru Group и «умные» ответы в Почте Mail.Ru, как работают рекомендации и компьютерное зрение во ВКонтакте и Одноклассниках, а также машинный перевод в Alibaba и что такое Quantum Machine Learning, а также многое-многое другое!
Подробности и программа конференции

Ближайшие события

Персонализируй это. Отчёт с Avito Data Science Meetup: Personalization

Время на прочтение2 мин
Охват и читатели3.1K

Всем привет! Публикуем отчёт с митапа Avito Data Science Meetup: Personalization, который проходил у нас в офисе. Участники обсуждали моделирование пользовательских предпочтений в мультимодальных данных и кластеризацию волатильных объявлений с помощью EM-алгоритма. Под катом — видеозаписи, презентации, ссылка на фотоотчёт.


Последняя версия обновлений для наших суперспособностей. Рецензия на книгу Дэна Роэма «Рисуй, чтобы победить»

Время на прочтение6 мин
Охват и читатели8.5K
Зрение — ваша суперспособность. Вы уже обладаете всеми необходимыми инструментами, устройство у вас с рождения, а программное обеспечение включилось, как только вы впервые разомкнули веки. Теперь нужно установить обновления.
Так заканчивается новая книга Дэна Роэма "Рисуй, чтобы победить: проверенный способ руководить, продавать, изобретать и обучать". Её идея в том, что современное общение преимущественно визуально. И для того, чтобы общаться эффективно, нужно знать и использовать законы визуального мышления.

Из названия ясно, что книга будет полезна всем, кто руководит, продает, обучает. Хотя её можно адресовать вообще всем, кто мыслит и делится идеями с другими людьми: доступно описан процесс человеческого мышления и способы опоры на него в любой коммуникации.
Читать дальше →

Анализ данных с использованием Python

Время на прочтение8 мин
Охват и читатели230K

Язык программирования Python в последнее время все чаще используется для анализа данных, как в науке, так и коммерческой сфере. Этому способствует простота языка, а также большое разнообразие открытых библиотек.


В этой статье разберем простой пример исследования и классификации данных с использованием некоторых библиотек на Python. Для исследования, нам понадобится выбрать интересующий нас набор данных (DataSet). Разнообразные наборы Dataset'ы можно скачать с сайта. DataSet обычно представляет собой файл с таблицей в формате JSON или CSV. Для демонстрации возможностей исследуем простой набор данных с информацией о наблюдениях НЛО. Наша цель будет не получить исчерпывающие ответы на главный вопрос жизни, вселенной и всего такого, а показать простоту обработки достаточно большого объема данных средствами Python. Собственно, на месте НЛО могла быть любая таблица.


Читать дальше →

Tooltip-ы в Power BI — новая функция для Desktop

Время на прочтение4 мин
Охват и читатели15K
В середине марта вышло очередное обновление Power BI Desktop. Microsoft добавил пару интересных функций, в том числе возможность пользователям самим создавать всплывающие подсказки — Tooltips.

В этой заметке я покажу простой пример работы с этой функциональностью.
Читать дальше →

Визуализация на карте распределения голосов по Москве на выборах президента 2018

Время на прочтение16 мин
Охват и читатели11K

Введение


Выборы — крайне загадочный процесс, при просмотре значений результатов которого не совсем понятна общая картина. Я решил показать их на карте Москвы с делением по районам c помощью технологий InterSystems, которые обеспечивают и хранение, и анализ данных. В данном случае использовалась платформа для интеграции и разработки приложений InterSystems Ensemble, но с равным успехом можно развернуть описанное ниже решение и на мультимодельной СУБД InterSystems Caché, и на новом продукте InterSystems IRIS Data Platform.
Читать дальше →

Ученье — свет, или как организовать мастер-класс за 2 дня

Время на прочтение10 мин
Охват и читатели2.7K


Обучение новых пользователей и разработчиков служит одним из основных инструментов популяризации своего продукта или технологии. Наша компания несколько месяцев назад начала приоткрывать «завесу» над своей технологией и привлекать новых разработчиков к платформе, на которой мы разрабатываем оригинальные приложения по 3D-аналитике. Естественно, что мы столкнулись с необходимостью обучения новичков.

В данной статье я опишу опыт нашей компании по организации обучения новой команды разработчиков или, другими словами, как собрать образовательную программу из подручных материалов.

Чем статья может быть полезна вам?


Если перед вами стоит задача за несколько дней подготовить программу обучения, то можете воспользоваться данной статьей, как пошаговой инструкцией. Также здесь описан перечень артефактов, которые стоит подготовить для успешной организации «передачи знаний». Если же ваша технология или продукт еще не готовы к «отторжению от лона проматери», но у вас есть планы по привлечению новых последователей в дальнейшем, то в статье вы найдете несколько идей по поводу того, какие документы вам стоит начать готовить и что описывать.

Наша программа обучения состоит из 2 этапов: мастер-класс и онлайн-обучение.
В данной статье мы рассмотрим проведение мастер-класса. Об удаленном онлайн-обучении напишу в следующей статье. Поэтому, пожалуйста, оставляйте под статьей свои комментарии, и я обязательно учту их при написании второй части.

«Cделать красиво». Визуализация обучения с Tensorboard от Google

Время на прочтение5 мин
Охват и читатели37K
image

Красота, как известно, требует жертв, но и мир обещает спасти. Достаточно свежий (2015г) визуализатор от Google призван помочь разобраться с процессами, происходящими в сетях глубокого обучения. Звучит заманчиво.

Красочный интерфейс и громкие обещания затянули на разбор этого дизайнерского шайтана, с неинтуитивно отлаживающимися глюками. API непривычно скудный и часто обновляющийся, примеры в сети однотипны (глаза уже не могут смотреть на заезженный MNIST).

Чтобы опыт не прошел зря, решила поделиться максимально простым описанием инсайтов с хабравчанами, ибо рускоязычных гайдов мало, а англоязычные все как на одно лицо. Может, такое введение поможет вам сократить время на знакомство с Tensorboard и количество ругательных слов на старте. Также буду рада узнать, какие результаты он дал в вашем проекте и помог ли в реальной задаче.
Читать дальше →