Визуализация информации и статистики

    Так уж получилось, что время от времени мне приходится работать со статистикой, а следовательно задаваться вопросом «В каком виде ее лучше представить другим людям?» Поэтому, сегодня я расскажу вам о некоторых весьма оригинальных способах визуализации разного рода статистических данных.

    Для начала приведу пример одной визуализации, сделанной с помощью Processing.
    В ее основу входит ежегодная статистика наиболее освещаемых газетой New York Times людей и организаций, а связи между ними показаны линиями.
    image
    По ссылке можно посмотреть визуализации за каждый год с 1984.


    Способ второй, пожалуй, самый неоригинальный, тем не менее, он тоже заслуживает внимания. Для примера возьмем сервис Lovely Charts, который, подобно своим конкурентам, позволяет строить схемы, карты сайтов и диаграммы онлайн. Подобных сервисов бесконечное множество, но я остановился на этом, потому что недавно встеритил упоминание о нем на одном ресурсе, и он мне понравился. Построение схем не представляет особо труда, в чем вы можете сами убедиться, зарегистрировавшись на сайте. Вот пример того, что получилось у меня за пару минут:
    image

    Программа UUrold визуализирует статистику и привязывает ее к различным политически единицам. Реализуется это путем «надстройки» трехмерной диаграммы над политической картой мира. В программу встроен специальный плеер, и, если, скажем, статистика собиралась несколько лет подряд, по изменению высоты диаграммы, можно в реальном времени пронаблюдать, как она варьировалась год от года. На словах описать это трудно, поэтому выкладываю авторское видео.

    В некомерческую поставку программы входит огромная статистическая база (более 10 000) из различных областей, от медицины до экономики. Конечно же существует возможность добавления своей собственной.

    Тримапинг. Тримапинг возник еще в начале 90, но широкого распространения не получил и в наши дни. Изначально тримапинг использовался для визуализации данных о дисковом пространстве, но впоследствии и для других целей. Суть этого способа визуализации заключается в представлении иерархической (древесной) системы в виде гнезд-прямоугольников. Каждый прямоугольник, при подобной визуализации, имеет пропорциональную статистическим данным площадь. Зачастую это помогает по-новому взглянуть на структуру данных. Самая известная утилита для изготовления тримапов — одноименная Treemap 4.0
    А вот пример удачного тримапинга на основе Google News:
    image

    Интерактивный вариант здесь.

    Вот пожалуй и все. Если статья будет интересна читателям и у них будут какие-то вопросы по созданию подобных визуализаций, это, возможно, станет темой для следующей статьи. Спасибо, жду ваших комментариев.
    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More
    Ads

    Comments 33

      +2
      способы интересные, но лично мне удобнее оценивать статистику по круговой диаграмме, нагляднее что ли
      • UFO just landed and posted this here
        +1
        Тримапинг с google news хорош, но никто не будет читать новости у которых шрифт 1-3pt. Выходит нам навязывают определенный круг новостей, фокусируя внимание только на том, что надо «им». Да и читать —
        Murd
        och
        'racist'
        cartoo
        n
        apolog
        y

        совсем не удобно
          0
          Очевидно, там ничего интересного)

          Подсказки, кстати, всплывают, так что прочесть можно.
            +1
            Ребята, все знают что там подсказки :). Но пользователь не хочет лишних телодвижений, я прав?
            0
            На всплывающих подсказках можно прочитать весь текст.
            Использовать такой вид статистики помимо основного можно и он подойдет для многих видов данных.
            Будет оригинальный вид.
            +2
            Цель статьи — дать людям альтернативу в случае, когда им необходимо свежо и по-новому преподнести статистику. Первый способ — художественный, четвертый — оригинальный и специфический, третий можно использовать вместо приевшихся круговых диаграмм, и он лишь вызовет восторг у неискушенной публики (в двух своих презентациях я использовал именного его и получил отличные отзывы).
            Что касается Google News, здесь тримапинг действует точно как облако тегов и формируется в зависимости от количеста запросов той или иной новости. Никакого навязывания, самое популярное будет занимать большую площадь.
              0
              Пишите ещё!)
              +1
              А вы использовали какие-то из этих видов статистики для решения реальных задач?
                0
                Первый способ дико понравился своей выразительностью и красочностью, а я о нём и не знал. :)

                Интересно, а тримапинг можно ли реализовать на яве, и сколько это будет тратить ресурсов?
                • UFO just landed and posted this here
                  0
                  Первая картинка —«епт это же метро»

                  А тримап великая прога, в былые времена, когда объём дисков не поспевал за моими запросами, очень помогала.
                    0
                    Как раз использую treemaps в прототипе форумного двига. :)
                      0
                      Спасибо, ждем продолжения!
                        0
                        большое спасибо за статью.
                        зы: опечатались в названии UUorld
                          0
                          Первая — шикарная!
                            0
                            А мы по-старинке облаком тегов (http://www.tvnewz.ru/) — Дмитрий Медведев чуть отстает от России :))

                            Хотя в разработке и более интересные варианты — если получатся, тоже смогу осветить их.
                              +2
                              Связность автономных систем красиво визуализируют

                                +1
                                Немного в сторону, но мне очень нравится для создания MindMap и т.п. сервис bubbl.us
                                  0
                                  Отдельное спасибо за Lovely Charts, очень понравился
                                    +1
                                    освещяемых

                                    «ча», «ща» пиши с «а».

                                    Извините за такое буквоедство, но сразу бросилось в глаза :(
                                      +2
                                      Эх, а ведь это лишь капля в море красивых визуализаций. Сходите для начала сюда: www.visualcomplexity.com/vc/
                                        –1
                                        у меня такое ощущение, что такая же статья на хабре уже была…
                                        • UFO just landed and posted this here
                                            0
                                            может картинка «по фрейду»?
                                            0
                                            Для примера возьмем сервис Lovely Charts, который, подобно своим конкурентам, позволяет строить схемы, карты сайтов и диаграммы онлайн. Подобных сервисов бесконечное множество..


                                            А можно подробнее про бесчисленное множество? Давно ищу хороший бесплатный он-лайн сервис для разработки схем, UML.
                                              0
                                              Ух! Это во истину потрясающая тема! =)
                                              Я думаю в ближайшем обозримом будующем развиватся именно в этом направлении ибо что может быть прекраснее чем совместить двоичный код и изобразительное исскуство.
                                              А какой простор для изучения различных алгоритмов (по типу L-system, genetic и еще много всего интересного).

                                              Сам, на данный момент, играюсь с NodeBox (программа пока что только под MacOS, но версия 2.0, которая должна скоро выйти будет кроссплатформенная). Причем написана она на питоне, так что для меня дополнительная возможность повысить квалификацию =)
                                              nodebox.net
                                                0
                                                На «Эхо Москвы» сегодня как раз хорошая передача была в тему, «Назад в будущее: Океан информации»
                                                Аудиофайл «тут»
                                                Пригласили толкового на мой взгляд гостя, к тому же с хорошей манерой вести беседу
                                                  +2
                                                  На вскидку добавлю несколько ссылок из личного избранного на Хабре на тему визуализации данных.
                                                  1) 14 бесплатных Web-приложений для совместной работы. Там рассказано про Bubble.Us, который упоминался в комментариях, и всякие другие полезные вещи.
                                                  2) Nikon: Интерактивная шкала масштабов нашей вселенной. Очень интересный пример визуализации от Nikon.
                                                  3) На Хабре где-то была статья, но сейчас потерялась, о чудесном проекте ManyEyes от IBM. Использовала его для визуализации данных для дипломного проекта. Очень полезно, все были под впечатлением. Огромное количество вариантов визуального предоставления данных. Надо немножко дружить с английским, чтобы разобраться, что там и к чему.
                                                  4) Создаем HeatMap с помощью Google Spreadsheets.

                                                  Автору совет на будущее: вообще не плохо было бы пользоваться поиском по ресурсу и самому вставлять ссылки на статьи подобного содержания для тех, кто хочет узнать больше по данной теме, потому что виджет «Похожие публикации» не всегда находит нужные статьи. :)
                                                    0
                                                    Тримапинг очень хорошо подходит для визуализации результатов профайлинга, как пример — KCachegrind.
                                                      0
                                                      А встречали ли Вы тримапинг для сайтов с информационным наполнением? То есть я говорю о некоторой замене облака тегов но с более наглядным представлением.
                                                        0
                                                        древесной -> древовидной
                                                          0
                                                          Спасибо за статью, и за хорошие ссылки в комментах.
                                                          Ищу специалиста для реализации Treemap, или подскажите кто знает хорошие библиотеки. Желательно не яву, ява машинка не у всех, и не у всех у кого стоит, работает.

                                                          Only users with full accounts can post comments. Log in, please.