Привет, меня зовут Евгений Кириёк, я занимаюсь HR-аналитикой, преподаю и рассказываю про специфику анализа данных в области управления персоналом.
Работая с отчетностью, я периодически сталкиваюсь с искажениями данных - иногда случайными, а иногда вполне осознанными. Последний случай заставил меня задуматься, насколько всё-таки справедливо избитое выражение: «Есть ложь, есть большая ложь, а есть статистика», и насколько разнообразны приемы, позволяющие манипулировать данными и их восприятием аудиторией.
Ниже - несколько типичных приёмов такого рода манипуляций через визуализацию. Примеры я привожу на базе стандартного Excel, дабы было понятно, что даже такими несложными средствами визуализации можно добиться существенного искажения восприятия, что уж говорить про использование более специализированного софта и дизайнеров.
1. Изменение восприятия тренда через размерности шкалы и сетки
Начну с самых простых и распространённых способов искажения восприятия данных через изменение размерности шкалы и сетки.
Предположим, вам нужно визуализировать результаты текучести персонала. В ходе подсчёта вы получили рост показателя за год в 2,5 раза. Базовый график ниже.

Но бизнес не хочет акцентировать на этом внимание в своем отчете и поэтому решает несколько сгладить этот рост средствами «правильной» визуализации.
Сначала убирает горизонтальную сетку и метки данных, оставив только результат декабря. Отсутствие такой разметки снижает восприятие динамики показателя и рост уже не так бросается в глаза.
Дальше меняет масштаб самой сетки и максимум/минимум по ней, то есть расширяет диапазон. Чем больше этот диапазон, тем менее заметен на нём какой-либо тренд. Это один из ключевых приемов, который часто используют компании чтобы скрыть негативную динамику того или иного показателя или наоборот, акцентировать внимание на росте. В исходном графике максимум шкалы Y составлял 30% и это довольно точно передает динамику роста, а в версии ниже, максимум шкалы Y уже 100% и посмотрите, насколько иначе выглядит сам график и «читаются» на нем результаты.
Наконец, играем с цветом. Оттенки зеленого и синего на различного рода графиках воспринимаются нами как «положительные», оттенки серого, а также пастельные цвета – как нейтральные и не привлекают внимание, а насыщенные цвета: красный, оранжевый и фиолетовый как цвета повышенного внимания. Так что, если компания хотим привлечь чье-то внимание, то красит элементы в оранжевый, а если сделать что-то менее заметным – в серый.

В итоге компания получаем график, который, при том, что он абсолютно корректный, уже не дает особого понимания ни тренда, ни динамики показателя, а лишь констатирует факт текучести в декабре. ОК, 26% в декабре, ничего особенного, идем дальше.
2. Искажение восприятие данных через использование двойных шкал.
Ещё один известный способ искажения восприятия данных, к которому иногда прибегают компании - добавление второй шкалы данных. Такого рода графики, во-первых, воспринимаются гораздо сложнее, особенно неискушённой публикой, а во-вторых, из-за возможности использовать несоразмерные шкалы на одном графике есть возможность «уничтожить» тренд и динамику одного из показателей.
В качестве исходных данных компания берет все ту же текучесть в процентах и эту же самую текучесть, но уже в людях, и размещает оба графика на одной шкале. Но так как текучесть в людях — это целые числа, а % — это дробные числа, то если компания сделаем одну из шкал основной, а вторую — вспомогательной, то окажется, что процентная шкала просто «растворилась» в основной, и никакой динамики роста процентной шкалы мы больше не увидим.

А ведь можно пойти ещё дальше и вместо текучести в людях добавить на шкалу рост персонала. Ну, а что, вполне нормально сравнить текучесть и рост. Переназвать график «прирост vs текучесть» — и всё, рост текучести в 2,5 раза просто «исчезнет».
3. Искажение реального объема через графики с накоплением
Ещё один довольно популярный прием искажения реальных данных, который использовали даже такие крупные компании, как Apple и P&G, — использование графиков с накоплением.
Суть его в том, что такие графики отображают не динамику показателя во времени, а совокупный объем показателя на каждый шаг наблюдений, тем самым визуально существенно искажая динамику тренда.
В таблице ниже объем продаж компании на каждый месяц года. Корректно будет использовать график, который будет отображать динамику продаж в течение года, но, с другой стороны, компания может использовать и график с накоплением, при котором каждый месяц будет отображать уже совокупность продаж к конкретному месяцу. В сущности, это вполне валидный метод репрезентации данных - показывать ее с учетом накопления, но аудитория из названия графика этого нюанса, конечно же, не поймет и будет воспринимать данные как объем продаж на каждый месяц.

Не знаю, как вы, но я бы точно вложился в компанию, которая демонстрирует второй график, а не первый. Хотя на самом деле объем их продаж абсолютно идентичный.
4. Изменение восприятие через объемные фигуры и пиктограммы
Довольно часто в инфографике используются не плоские графики, а объемные изображения или графическо-визуальные элементы замещающие стандартные виды графиков. Безусловно такие варианты визуализации могут смотреться более выигрышно и интересно нежели их плоские аналоги, однако добавление цвета и объема визуально способно исказить восприятие информации.
В рамках нашего примера покажем долю нашего подразделения в общем объеме. Можно использовать стандартный пай чарт ,который для этого отлично подойдет, а можно использовать объемный, вывести нашу долю вперед, вытащить ее из целого, таким образом выделив ее визуально и сделав более значительной относительно других долей. Далее изменить цветовую гамму таким образом, чтобы на цвет нашей доли приходилась самая темная часть пай чарта, а на действительно самую большую долю – самая светлая. При этом даже не обязательно убирать метки данных. Из-за светлого фона самой большой части – она (часть) становится «невидимой», а наша, из-за перспективы и темного насыщенного цвета выгодно выделяется и кажется если и не самой большой, то точно сопоставимой с самой большой по размерам в то время как реальная разница составляет 10%.

Еще один пример визуального искажения реальных пропорций, но на этот раз через пиктограммы. Реальный размер данных на плоской гистограмме отображает высота столбца, но если мы будем использовать объемные изображения или пиктограммы, вместо стандартных столбцов, то за счет появления объема и глубины изображения, разница в два раза уже будет восприниматься как разница в четыре, а то и в пять раз, при этом реальное различие, как видно по картинке, остается таким же.

Выводы
Примеры выше - лишь некоторые способы того, как можно добиться изменения восприятия данных через «правильно» выбранные средства визуализации. И заметьте, ни в одном из них компания не обманывает аудиторию через искажение цифр и исходных данных, просто правильно выставляет свет и акценты. Кто-то делает это по ошибке, а кто-то вполне осознанно. Особенно много подобных примеров можно найти в материалах, которые вам пытаются что-то продать или в чем-то убедить. А ведь это только один из возможных инструментов введения аудитории в заблуждение. Есть еще искажение через другие методы: трюки с процентами, весами, псевдо корреляции, манипуляции с выборками, с разными типами агрегаций, сравнения и пр. Мб расскажу о них в другой раз.
Так или иначе, единственное, что может вам помочь увидеть подвох, — собственное критическое мышление и готовность читать мелкий шрифт. В конце концов, часто отчетность — это не про то, что вам показывают, а про то, что вам не показывают.
