Как стать автором
Обновить

Комментарии 13

Спасибо за хорошую статью!
Присоединяюсь. Иногда по-настоящему хороший материал может быть подан не совсем правильно и из-за этого у читателя создается совершенно не то мнение, на которое рассчитывал автор. Ваши примеры надо принять во внимание всем, кто публикует данные, которые должны создать о компании/продукте определенное впечатление.
Почему Гомер начал бегать сразу с 6 кругов в первый раз, а во второй только с 1? Он никогда до этого не видел пончиков? Или это были специальные отравленные пончики? 0о
Кручу-верчу обмануть хочу.
Как же я люблю статистику и аналитику.
В разделе о Data Ink Ratio «улучшенный» вариант диаграммы не дотягивает до эталона (в соответствии с принципом minimal ink): нет рисок на самих столбиках и серый фон вполне можно убрать. Про фактор обмана, есть такая штука, закон Стивенса, он гораздо шире покрывает нюансы восприятия, чем приведённые примеры из Tufte, очень хорошо про это рассказывала Tamara Munzner в Keynote on Visualization Principles.

А вообще удачи в изучении визуализации, вы, как я понимаю, в самом начале пути, раз только открыли для себя Тафти.
Я как раз занимаюсь одним проектов в свободное время — визуализация экономики Украины: проект польностью открытый, исходник на гитхабе. Можно посмотреть живую страничку, ссылку давать не буду, дабы не сочли за рекламу.

Поскольку у меня опыта в визуализации статистики нет, но есть желание учиться, хочу попросить, по возможности, проверить на наличие каких-либо негативных представлений.

Конкретно, мне кажется, график импорта/экспорта сильно сложен. Но с другой стороны, разбивать на два отдельных графика нехорошо, поскольку важно еще и сравнить эти два показателя. Похожий график для бюджета страны (доходы и расходы) находится в разработке.

Так же, как мне кажется, есть проблема «слишком много информации». В общем, буду рад любой помощи и критике.
Вопрос к знатокам? Если взять вот этот график

Тортиковая вечеринка
image

Как все-таки лучше представить данные, чтобы можно было легче сравнивать?
Правильно ответить на этот вопрос можно только имея две вещи: сами данные и конечную цель, которую хочет достичь автор этой визуализацией.

Судя по данным, у нас есть категориальная переменная штат (набор штатов, не сравнимых между собой, i.e. непересекающиеся несравнимые группы), у нас есть ранговая переменная возрастная группа (то есть на ней есть порядок) и количественная переменная доля человеков выраженная в процентах.

  1. Так как штаты несравнимы, то естественно попробовать что-то из раздела bar-chart
  2. Заметим, что проценты складываются в 100%, значит это должно быть естественно отображено на графике, естественно попробовать доделать bar-chart до stacked-bar
  3. В зависимости от цели необходимо либо выделить интересующий параметр, либо отсортировать данные, либо провести дополнительную группировку
  4. Если наша задача показать на карте насколько старое молодое поколение живет в определенном штате, мы можем проанализировать штаты по отдельности и вывести для каждого числовое значение или определить его к некоторой группе: молодые, старички, смешанное население и т.д
  5. Или мы можем совместить карту и bar-chart, чтобы при необходимости детализировать информацию по каждому штату

И всё это нужно пробовать и смотреть, что лучше подходит и легче воспринимается.
Я хочу представить бюджет страны по направлениям за текущий год (круговая диаграмма лучше всего показывает структуру какого-то параметра), и дать возможность пользователю сравнить с предыдущими годами.

Вот ребята из Украинской Правды пошли иначе: http://www.pravda.com.ua/cdn/cd1/budget/final/budget.html
Визуализация по ссылке выглядит забавно, но слабо читаема, так как вообще нет меток и нужно наводить на каждый кружок. Сложно получить общую картину — придется держать все метки в голове.

Foreign Trade мне кажется надо дорабатывать по мелочам, например, метки слишком громоздкие (может всё выразить в миллиардах вместе миллионов и оставить один знак после запятой, укоротить текст?). Если export\import категории совпадают, то может быть stacked-bar попробовать и отсортировать по сумме?

Тут, думаю, стоит экспериментировать и смотреть, что лучше. Круговые диаграммы — это не всегда плохо, но они невероятно часто используются не к месту.
Спасибо за помощь. Обязательно попробую.

Вы имеет в виду такой stacked-bar? Как тогда оценить иморт/экспорт в целом?
Можно скомбинировать график, добавив небольшую круговую диагамму для полноты картины, как здесь (просто как пример комбинации)
Карта с медианным возрастом населения — классика отображения возрастной стуктуры.
А дальше, действительно, куча вариантов в зависимости от того, что мы хотим показать.
Спасибо за просветляющую статью.
Udacity в видео использовал материалы, созданные darkhorseanalytics. У первых есть ещё один хороший курс по статистике, а у последних — другие визуализации. Мне, к примеру, нравится таблица:
Скрытый текст
image
Такое ощущение, что MS Office специально делает такие страшные таблицы по умолчанию. Выглядит приятненько, но информацию ни черта не разглядеть.

Есть и Pie Chart:
Скрытый текст
image
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории