Визуальные искажения данных

    Важно: эта статья не про политику!

    Источник: info.minfin.ru/fbrash.php
    Диаграмма расходов бюджета с сайта Минфина прекрасна во многих отношениях, именно с неё я начну рассказ о том, как мы, зачастую непреднамеренно, искажаем данные, выбирая для них неподходящую визуализацию. Искажение данных — на мой взгляд, безвыигрышный путь: тех, кто не заметит проблему, мы введём в заблуждение, а те, кто заметит, возможно, подумают, что мы это специально, ещё и гадостей напишут в этих ваших интернетах. Имхо, искажать данные следует только умышленно. Давайте разберёмся, как избежать в этом вопросе случайностей.

    Объёмные искажения


    Скопируем данные с сайта Минфина в условный эксель и нарисуем рядом две одинаковые диаграммы, отличающиеся только порядком строк:


    Одни и те же цвета соответствуют одинаковым статьям расходов, но посмотрите, как сильно сектора отличаются по размеру. На правой диаграмме «социальная политика» (тёмно-зелёный сектор) — несомненный лидер, но на левой она выглядит, пожалуй, меньше, чем «национальная экономика» (оранжевый сектор). Только ленивый не сказал, что объёмные круговые диаграммы искажают пропорции, но они до сих пор встречаются. Во время выступления у зрителей может не быть времени, чтобы вдумчиво вникнуть в цифры, и они запомнят визуальные соотношения, которые окажутся неверны. Если кто-то об этом не слышал или слышал, но не верил, надеюсь, теперь я вас убедил.

    Искажения, связанные с площадью


    Ещё один распространённый способ запутать зрителя — сравнение чисел в виде фигур, имеющих два измерения. Чем прекрасен бар-чарт? Столбики по факту имеют одно измерение, длину, так как ширина у всех столбиков в диаграмме одинаковая. Если же мы вместо столбиков используем какие-нибудь двумерные (а то и трёхмерные, не к ночи будь помянуты) фигуры, то сравнительная величина представленных чисел уже не так очевидна графически. Пытливый зритель, как минимум, задумается, соответствует числу площадь или линейный размер фигуры. Проиллюстрирую эту мысль примером из выступления Дэвида МакКэндлеса:


    Интересующий нас фрагмент начинается с 10:26 и заканчивается на 12:15 (чуть меньше двух минут), вот точная ссылка на его начало.

    Правда про прямоугольники военных бюджетов проясняется довольно быстро: когда докладчик начинает размещать много прямоугольников внутри того, который представляет бюджет США, становится понятно, что речь идёт о площади. Но в самом начале это не очевидно и меня, например, отвлекало.

    С солдатами же, представляющими численность армии, всё сложнее: площадь солдата прикинуть труднее, размещать их друг в друге невозможно, и, поскольку это человечки, мы их подсознательно оцениваем скорее по росту, чем по площади:



    Израильский солдат, который вообще-то почти вдвое меньше северокорейского (2 482 против 4 711), выглядит вполне сравнимым, а эритрейского солдата на глаз и вовсе не отличишь.

    Думаю, дело в том, что МакКэндлесс, среди прочих своих специальностей, ещё и журналист. Это в данном случае не ругательство, просто для журналов или сайтов инфографика имеет свою специфику по сравнению с презентациями. В журнале или на сайте человек не ограничен временем просмотра, зато ему ещё проще переключиться на что-то другое. Поэтому там его надо в первую очередь развлечь и показать что-то красивое, а он уж потом сам и на цифры посмотрит, и прикинет, что к чему. Во время выступления время у нас ограничено, поэтому на каждую диаграмму мы не можем выделить много, а её ещё и не вдруг разглядишь. А нам-то надо, чтобы мысль была однозначно проиллюстрирована и моментально понятна. Если очень хочется воздействовать публике ещё и на эмоции (а всегда хочется, что уж), то можно фоном к диаграмме положить какую-нибудь военную картинку вплоть до «Апофеоза войны» Верещагина.

    Вижу много статей, в которых авторы рекомендуют перестать использовать стандартные диаграммы в презентациях и искать индивидуальную визуальную метафору к каждому элементу данных, которые вы представляете. Так вот, предлагаю к этим статьям, когда они вам попадаются, относиться критически.

    Вывод


    Когда готовите слайды с данными, проверяйте, не вступает ли в ваших слайдах смысл в конфликт с красотой, и в ситуации или-или без колебаний выбирайте смысл.

    Бонус для внимательных читателей, добравшихся до конца


    МакКэндлес упоминает как своего учителя Ханса Руслинга. Руслинг-то прекрасен, но он и пользуется площадью кружочков, а не солдатиков. Для тех, кто с его творчеством не знаком, может быть интересно посмотреть на его подход к визуализации данных. Я просто оставлю это здесь:

    Тренинги Романа Поборчего

    19,00

    Компания

    Поделиться публикацией
    Комментарии 8
      0
      Спасибо, интересно. Визуализация (точнее, правильная визуализация!) — наше все!
        0
        Когда что-то технологическое рассказываем, часто ведь приходится какие-то числа представлять. И всегда обидно, если рассказ отдельно, а числа отдельно, или если эти числа вообще утверждают что-то обратное основной мысли рассказа. Так что и правда наше всё, да.
        0
        Спасибо! Было интересно! =)
          0
          Ещё один очень распространённый приём — смещение осей (как правило, оси OX вверх) для создания иллюзии сильных изменений. Рост, например, курса валюты может выглядеть на графике устрашающим, но стоит сместить ось абсцисс к нулевой точке, и изменение окажется пшиком. На мой взгляд, это искажение встречается чаще всего.
            0
            Это делается не чтобы ввести в заблуждение, а чтобы продемонстрировать какой-либо фактор эффект от которого смазывается масштабом. Далеко не все темы затрагиваемые в презентациях ведут к скачкам ±50%, чтобы было видно в пуле на сотни миллиардов у.е.
            Например: компания продает 10 млн единиц товара в год — несколько лет подряд. Решили применить какие-либо новые инструменты. Если смотреть от 0 то 10,1 млн и 9,99 выглядят очень похоже, как и исходные 10 млн, в принципе. А эффект от нововведений кардинально разнится.
            Убедить менеджмент выбрать верный курс сможет визуализация относительно 10 млн.
            Да и едва заметное изменение курса валют для среднестатистического гражданина и международной корпорации имеет очень разные масштабы последствий и значение.
              0
              Всё верно. У этого приёма есть легитимное применение, и оно именно такое, как вы пишете. Бывает, что надо сделать зум, и бывает, что эти микроскопические колебания на самом деле выражают огромные разницы в прибылях и убытках.
              Но ради справедливости отметим, что и для введения в заблуждение это тоже, бывает, используется.
                0
                Соглашусь с вами и с p0b0rchy, что есть у такого приёма легитимное применение. С курсами валют мой пример был неудачным. Поскольку деньги делаются на колебаниях курса, вполне закономерно масштабировать график по их амплитуде. Однако слишком часто игры с масштабом используются, чтобы "убедить менеджмент выбрать верный курс", поэтому смещение осей — повод присмотреться повнимательнее, что же на самом деле график показывает.
                Есть, кстати, ещё один вариант этого типа искажений — неравномерные цветовые градации: визуальная оценка изменения интенсивности цвета может не соответствовать изменению в числах, поскольку авторами ставится цель привлечь внимание к разнице величин, а не абсолютным значениям. Часто применяется на картах, вот типичный пример: http://www.cdc.gov/vitalsigns/adultsmoking/images/state-info-mapa_626px.jpg
              0
              Да, правда, это действительно бывает часто, я в одной из предыдущих статей обращал внимание, что за этим занятием даже Джобс был замечен. У такого искажения иногда бывает смысл и благие намерения: можно себе представить ситуацию, когда нужно на графике точку перегиба рассмотреть или ещё что-то в этом роде, а при показе от нуля ничего не видно.

              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

              Самое читаемое