Результаты поиска по запросу «[data visualization]» / Хабр

Публикации Хабы Компании Пользователи Комментарии

sawabear_a 27 мар в 14:02

Управление цветами в Seaborn: как визуализировать данные красиво

Средний

20 мин

6.9K

Блог компании Lamoda TechPython*Визуализация данных*Презентации

Туториал

Привет, Хабр. В этой статье я расскажу про своё видение работы с цветом при визуализации графиков. Буду показывать все на примерах — уверен, они вам понравятся.

Я покажу не только картинки было-стало, но и приведу примеры кода, а также объясню логику принятия решений: как использовать ту или иную палитру в конкретной задаче. И что самое главное, дам пошаговые советы, как сделать график логичнее и понятнее для заказчиков.

Меня зовут Саша, сейчас я работаю в Lamoda Tech старшим бизнес/дата-аналитиком. До этого я несколько лет был специалистом по данным в другой компании и регулярно представлял совету директоров анализ и прогноз физических и бизнес-показателей. Умение донести результаты исследования до заказчика, особенно если он не погружен в работу с данными — это важный аспект моей профессии. Надеюсь, моя статья с этим немного поможет.

+25

Antipozitive 18 янв в 11:21

Уникальные стили визуализации данных в Python: от Cyberpunk до элегантности

Средний

5 мин

12K

Python*Визуализация данных*КиберпанкПрезентации

Из песочницы

Необычные стили для визуализации данных на Python: от киберпанка до эстетики. В статье рассмотрены 5 малоизвестных стилей для визуализации данных и создания дашбордов.

Figleglum 31 янв 2012 в 13:47

Treemap, доходы депутатов, и язык Processing

5 мин

6.3K

ИнфографикаProcessing*

Из песочницы

Читая топик на хабре «Госдума представила доходы депутатов в новом виде», я решил, что данные по доходам депутатов стоят визуализации. Когда-то знакомство с темой «Визуализация данных» у меня началось с языка Processing, поэтому в качестве инструмента выступал именно он. Ниже фрагмент одной из первых картинок, а дальше можно познакомиться с тем, что такое Treemapping и как его готовить на Processing'е.

Читать дальше →

+50

DPavlov 20 сен 2016 в 14:04

Ontodia + Caché — визуализатор онтологий для навигации по хранимым сущностям InterSystems Caché

6 мин

3.3K

Блог компании InterSystemsJavaScript*Визуализация данных*

Про библиотеку Ontodia

Для начала имеет смысл остановиться на том, что же такое Ontodia и что такое СУБД Caché. Пожалуй, начнем с пока что менее известного продукта — Ontodia. Ontodia — это результат совместного проекта международной лаборатории ISST Университета ИТМО и компании VISmart, занимающейся разработкой программного обеспечения в области семантического веба (semantic web). Сервис Ontodia изначально был веб приложением, предназначенным для визуализации исключительно связанных данных (linked data) и онтологий. Мы создали этот сервис, потому что не сумели найти простых, доступных и эффективных инструментов понятной визуализации связанных данных семантического веба.

Читать дальше →

+13

qc-enior 10 ноя 2016 в 11:56

Создание интерактивных графиков с R и Highcharts

6 мин

7.4K

Data Mining*R*Визуализация данных*

Туториал

Перевод

Иногда в попытках решить простые задачи приходят в голову великие идеи. Это особенно верно для разработчиков, которые готовы приложить массу усилий для решения простой проблемы к полному своему удовлетворению. Эта история о том, как Торстейн Хенси, основатель и СРО Highcharts искал простой инструмент для создания графиков, чтобы поместить на свою домашнюю страницу замеры глубины снега на Викафьеллет, местной горе, где у семьи был коттедж. Разочаровавшись в обычных flash-расширениях и коммерческих решениях, доступных на тот момент, он решил создать собственное и, конечно же, им поделиться.

Для создания красивых графиков в этой статье я воспользуюсь пакетом highcharter Джошуа Кунста, оболочкой для javascript-библиотеки Highcharts и Shiny.

Пожалуйста, учтите, что все продукты в этой библиотеке бесплатны для некоммерческого использования. Для коммерческих проектов и сайтов воспользуйтесь этим.

Читать дальше →

+13

shapovalowa-netology 31 окт 2017 в 16:43

11 правил визуализации данных

6 мин

86K

Блог компании НетологияВизуализация данных*Графический дизайн*

Recovery Mode

Ольга Базалева, создатель Data Vis и автор блога, написала статью специально для Нетологии о самых важных принципах визуализации. Статья участвует в конкурсе блога.

Хотите выделяться на фоне конкурентов? Чтобы ваши статьи, отчеты, презентации или посты в социальных сетях были профессиональными, интересными и доступными широкой аудитории? Используйте визуализацию данных!

Я более семи лет отработала в крупнейших медиакомпаниях и рекламных агентствах, на счету Афиша, Рамблер, РБК, создала сайт с наглядными обзорами рынков и собственный блог про визуализацию данных. Поэтому я очень хорошо понимаю то, о чем пойдет речь ниже.

Сегодня визуализация особенно важна, так как люди теряются в обилии окружающей информации и на ее восприятие тратится слишком много времени. Поэтому скучные непонятные тексты часто остаются без внимания. Читатель не будет тратить время, чтобы в них разобраться.

Читать дальше →

+23

PoltP 27 ноя 2017 в 03:00

Дашборд — что это и почему он будет вам полезен или современный способ сделать тайное явным

12 мин

262K

Блог компании Developer SoftИнтерфейсы*Usability*Визуализация данных*

Наверное, мало кто из нас задумывался, что практически с рождения пользовался дашбордами. Мы получали некую информацию, анализировали, принимали решение или даже испытывали какие-то эмоции благодаря им. Да-да, градусник, измеряющий температуру, когда вы болели; часы; стрелка спидометра, перевалившая за 200 км/час (ну, это может быть не у всех) — все эти приборы по сути являются дашбордами или их элементом. Но мне бы хотелось рассказать об интерактивных аналитических дашбордах. И, самое главное — показать, что в наше время такие дашборды могут быть полезны каждому человеку, а не только крупным банкам или корпорациям.

Если у вас есть данные — не важно, домохозяйка вы с пачкой чеков от закупок продуктов, спортсмен с данными о пробежках из Strava или кто-либо ещё — вы сможете представить это наглядно, оценить важные показатели, в результате чего принимать более оптимальные решения.

Вы не используете дашборды и думаете, что вам это не нужно? Мнение может поменяться, а кругозор расширится, так как далее: что такое дашборды, какие цели достигаются с помощью них, ключевые понятия и сферы использования, существующие инструменты, множество ссылок на актуальные ресурсы по теме, а также реальный пример, как из обычных на первый взгляд данных, можно извлечь интересные знания…

Читать дальше →

+33

ikashnitsky 27 дек 2017 в 17:08

Добыча данных в R

14 мин

19K

Data Mining*API*R*Открытые данные*Визуализация данных*

Этот пост — перевод трех частей серии Data acquisition in R из моего англоязычного блога. Исходная серия задумана в четырех частях, три из которых легли в основу данного поста: Использование подготовленных наборов данных; Доступ к популярным статистическим БД; Демографические данные; Демографические данные. В еще не написанной заключительной части речь пойдет об использовании пространственных данных.

R заточен под воспроизводимость результатов. Существует множество прекрасных решений, обеспечивающих сопоставимость версий системы и пакетов, помогающих применять принципы literate programming… Я же хочу показать, как можно легко и эффективно находить/скачивать/добывать данные, используя собственно R и документируя каждый шаг, что обеспечивает полную воспроизводимость всего процесса. Разумеется, я не ставлю перед собой задачи перечислить все возможные источники данных и фокусирую внимание в основном на демографических данных. Если ваши интересы лежат вне сферы статистики населения, стоит посмотреть в сторону великолепного проекта Open Data Task View.

Для иллюстрации использования каждого из источников информации я привожу пример визуализации полученных данных. Каждый пример кода задуман как самостоятельная единица — копируйте и воспроизводите. Разумеется, сперва необходимо установить требуемые пакеты. Весь код целиком лежит тут.

Читать дальше →

+21

afrikyan 29 янв 2019 в 17:24

Предиктивная аналитика данных — моделирование и валидация

15 мин

32K

Python*Data Mining*

Туториал

Перевод

Представляю вашему вниманию перевод главы из книги Hands-On Data Science with Anaconda
«Предиктивная аналитика данных — моделирование и валидация»

Наша основная цель в проведении различных анализов данных — это поиск шаблонов, чтобы предсказать, что может произойти в будущем. Для фондового рынка исследователи и специалисты проводят различные тесты, чтобы понять рыночные механизмы. В этом случае можно задать много вопросов. Каким будет уровень рыночного индекса в ближайшие пять лет? Каков будет следующий ценовой диапазон IBM? Будет ли волатильность рынка увеличиваться или уменьшаться в будущем? Каким может быть влияние, если правительства изменят свою налоговую политику? Какова потенциальная прибыль и убытки, если одна страна начнет торговую войну с другой? Как мы прогнозируем поведение потребителя, анализируя некоторые связанные переменные? Можем ли мы предсказать вероятность того, что студент-выпускник успешно закончит учебу? Можем ли мы найти связь между определенным поведением одного конкретного заболевания?

Поэтому мы рассмотрим следующие темы:

Понимание предиктивного анализа данных
Полезные наборы данных
Прогнозирование будущих событий
Выбор модели
Тест Грэнджера на причинность

Читать дальше →

+18

artzub 28 мар 2013 в 16:47

Github Visualizer — Сервис визуализации истории репозиториев с GitHub

7 мин

16K

JavaScript*Git*Canvas*

Будучи поклонником программных продуктов для визуализации активности в репозиториях таких как code_swarm и gource. В один прекрасный день я был посещен музой, которая вдохновила меня создать онлайн сервис для визуализации статистики репозиториев с GitHub.
И сегодня хочу предоставить на ваш суд мой проект GitHub Visualizer (проект на GitHub).
Вот скринкаст для предварительного знакомства.

И не большая Gif'ка

Что использовано

SVG, Canvas — для интерактивной графики.
D3.js — javascript библиотека позволяет очень удобно работать с данными и визуализировать их.
Гигантская коллекция примеров от автора библиотеки Mike Bostock.
API GitHub

Читать дальше →

+44

a_bogdanova 5 июн 2020 в 10:59

Kibana Tips & Tricks: How to view events in Discover mode

3 мин

Визуализация данных*

Туториал

Hi Habrausers!

As you may know Kibana is a visualization instrument, part of ELK (Elastic, Logstash, Kibana) stack. With the help of Kibana you may analyze and visualize your data, build different charts and combine them on the dashboard to present data in the most beautiful way.

People who use Kibana in our company have different background — some of them are technical who process data, some are managers who simply want to monitor some KPIs. And all have various questions. In spite of Kibana is rather popular in IT companies, there are not many articles or courses about it. To fill the gap I have created Kibana Tips & Tricks — weekly letters with frequently asked questions or themes. Such letters help our users to become more familiar with Kibana. There are no secrets — just detailed description of how you may work with your data.

I would like to share the first part of 'Kibana Tips & Tricks' with you — series of simple how-to articles for people who would like to know more about data analysis and visualization in Kibana. Today we will see how to view events in Kibana.

clearlist 24 июн 2014 в 12:28

3D модели вирусов человека. Часть вторая: молекулярное моделирование и биоинформатика

11 мин

13K

Блог компании Visual Science

В нашем первом посте про трехмерное моделирование вирусов мы перечислили основные стадии процесса и рассказали о том, с чего мы начинаем и как собираем исходную информацию. В этой заметке мы расскажем о следующем этапе работы — о создании моделей отдельных молекул, из которых впоследствии будет собрана целая частица.

Компоненты вирусной частицы Гриппа A/H1N1

Вирусная частица — это молекулярный механизм, решающий две принципиальные задачи. Во-первых, частица должна обеспечить упаковку вирусного генома и его защиту от деструктивных факторов среды, пока вирус путешествует из клетки, в которой он собрался, к клетке, которую он сможет заразить. Во-вторых, частица должна быть способна присоединиться к заражаемой клетке, после чего доставить вирусный геном и сопутствующие молекулы внутрь, чтобы запустить новый цикл размножения. Задач не очень много, поэтому вирусы, за редким исключением, могут позволить себе быть довольно экономными в том, что касается структуры.

Читать дальше →

+47

romapres2010 7 фев 2020 в 11:17

Сертификация по программе IBM Data Science Professional Certificate

11 мин

8.9K

Python*Визуализация данных*Машинное обучение*

Из песочницы

Статья является кратким обзором о сертификации по программе IBM Data Science Professional Certificate.

Будучи новичком в Python, мне пришлось столкнуться с реализацией задач:

Загрузка и парсинг HTML таблиц
Очистка загруженных данных
Поиск географических координат по адресу объекта
Загрузка и обработка GEOJSON
Построение интерактивных тепловых карт (heat map)
Построение интерактивных фоновых картограмм (choropleth map)
Преобразование географических координат между сферической WGS84 и картезианский системой координат UTM
Представление пространственных географических объектов в виде гексагональная сетки окружностей
Поиск географических объектов, расположенных на определенном расстоянии от точки
Привязка географических объектов к полигонам сложной формы на поверхности
Описательные статистический анализ
Анализ категорийных переменных и визуализация результатов
Корреляционный анализ и визуализация результатов
Сегментация с использованием k-Mean кластеризации и elbow метода
Анализ и визуализация кластеров

Читать дальше →

+13

clearlist 5 июн 2014 в 10:59

Научная, медицинская иллюстрация и анимация: как врачам и ученым общаться друг с другом, студентами и остальным человечеством

8 мин

33K

Блог компании Visual Science

Этим постом мы хотим дать общее представление о сфере, в которой работаем. В США, Европе, Канаде и Австралии публика о ней осведомлена, поскольку сама область научной и медицинской иллюстрации развита на порядок лучше, чем у нас. Мы вспомним историю вопроса, опишем как обстоят дела сейчас, какие задачи решают основные студии биомедицинской визуализации, расскажем про организации, которые этот рынок исследуют и курируют, а также поделимся некоторой статистикой.

Что это вообще такое? От рисования трупов к трехмерной анимации молекул и вирусов

В нашем организме около 206 костей разной формы и размера, более 600 мышц и сложно поддающееся подсчету количество нервов, сосудов, а уж тем более всевозможных клеток, относящихся к различным тканям и органам. Если углубиться сильнее, откроется картина огромного количества белков, РНК и других молекул, каждая из которых выполняет определенную функцию, а небольшие нарушения способны оказать драматический эффект на жизнедеятельность организма. Достаточно вспомнить прионы, которые из-за неправильного сворачивания молекулы могут вызвать серьезные заболевания.

Читать дальше →

+42

artzub 21 окт 2014 в 15:33

BlackHole.js с привязкой к картам leaflet.js

12 мин

23K

JavaScript*Maps API*Визуализация данных*

Туториал

Приветствую вас, сообщество!

Хочу предложить вашему вниманию, все таки доведенную до определенной точки, свою библиотеку для визуализации данных blackHole.js использующую d3.js.
Данная библиотека позволяет создавать визуализации подобного плана:
картинки кликабельные

или

Статья будет посвящена примеру использования blackHole.js совместно с leaflet.js и ей подобными типа mapbox.
Но так же будут рассмотрено использование: google maps, leaflet.heat.

Получится вот так =)

Поведение точки зависит от того где я находился по мнению google в определенный момент времени

Посмотрите, а как перемещались вы?...

Детали...

+34

MaxRokatansky 18 мая 2020 в 16:17

5 визуализаций, который помогут улучшить Data Story

5 мин

4.4K

Блог компании OTUSPython*Программирование*Big Data*

Перевод

Статья переведена в преддверии запуска курса «Разработчик Python».

Сторителлинг – один из важнейших навыков для специалистов, которые занимаются анализом данных. Чтобы доносить идеи и делать это убедительно, нужно простраивать эффективную коммуникацию. В этой статье мы познакомимся с 5 методами визуализации, которые выходят за рамки классического понимания, и могут сделать вашу Data Story более эстетичной и красивой. Работать мы будем с графической библиотекой Plotly на Python (она также доступна на R), которая позволяет создавать анимированные и интерактивные диаграммы с минимальными усилиями.

Читать дальше →

val6852 9 ноя 2021 в 14:36

Hazelcast + Kibana: лучшие друзья для исследования и визуализации данных

28 мин

2.1K

Data Mining*Kotlin*

Туториал

Перевод

Многие, если не все, проекты в области науки о данных требуют некоторого внешнего интерфейса для визуализации данных, чтобы отображать результаты для анализа данных людьми. Python, кажется, может похвастаться самыми мощными библиотеками, но не теряйте надежды, если вы разработчик Java (или если вы также владеете другим языком).

В этом посте я опишу, как вы можете сделать что-то полезное с помощью интерфейса визуализации данных, не написав ни единой строчки кода, лишь следуя пошаговому процессу.

tablum 9 ноя 2021 в 10:01

«BI or not to BI»: небольшая история разработки небольшого BI-сервиса

5 мин

5.4K

Блог компании EXTRACTUM.IOПрограммирование*SQL*Развитие стартапаОблачные сервисы*

В мае 2021 года меня похитили инопланетяне и приказали разработать сервис аналитики данных, в простонародье именуемый “self-service BI (business intelligence)”. И не просто какой-то аналог Redash или Superset в масштабе 1:43, а с нормальной поддержкой загрузки данных из файлов (локальных и через веб), ну и, конечно, с коннекторами к популярным базам данным. Например, чтобы можно было импортировать содержимое файлов json, xml или логов, а потом сджойнить их с выгрузкой из clickhouse. И ещё чтобы графики рисовались. Дашборды тоже было бы неплохо, но можно и без них.

Вот что они мне нарисовали в качестве ТЗ:

+30

MaxRokatansky 16 ноя 2021 в 17:20

Диаграмма воронки в Python

6 мин

10K

Блог компании OTUSPython*

Перевод

Диаграммы воронки зачастую используются для представления последовательного процесса. Они помогают смотрящему сравнивать и видеть, как цифры меняются от этапа к этапу.

В этой статье мы рассмотрим, как построить воронку с нуля с помощью Matplotlib, а затем рассмотрим более простую реализацию с помощью Plotly.

kmoseenk 26 ноя 2021 в 17:34

Воронка конверсии пользователей

9 мин

11K

Блог компании OTUSPython*

Перевод

Сегодня мы будем проводить анализ воронки и вычислять количество/процент пользователей, которые проходят по ее уровням, визуализируя всю конверсию в виде воронки.

Также мы немного расширим код, чтобы иметь возможность создавать сложенные воронки, в которых пользователи будут сгруппированы по определенным свойствам.