Риторика по-джедайски. Понятный учебник для убедительной речи - Коллектив авторов. Страница 23


О книге
наборе данных есть смысл. Когда мы создаем таблицы, отчеты и диаграммы, мы показываем лишь некоторый срез или слой данных, а не целостную картину. Эта целостная картина всегда шире, объемнее отчета. Именно ее мы и будем называть реальностью данных.

Реальность данных – это совокупность процессов и объектов, которые порождают данные.

Приведем пример того, как можно описать реальности данных.

«В университете учатся студенты. У них есть определенное расписание, в котором указано, что они изучают, когда, в какой аудитории, кто является преподавателем. Есть студенты, которые ходят на занятия, есть те, кто не ходит. Студенты получают баллы за свою активность в курсе и за выполнение заданий. Есть доля студентов, которые вовремя сдают зачеты и экзамены, а есть те, кто сдает не вовремя или не сдает вовсе».

Так выглядит реальность. Мы же имеем доступ не к самой реальности, а к данным о ней: таблицам с баллами, расписанию, отчетам, выгрузкам и т. д.

Вместо одной простой и понятной картинки у нас есть набор таблиц и диаграмм.

Наша задача – визуализировать реальность так, чтобы потери смысла были минимальными. Для этого нужно постоянно держать в голове полную картину и сверяться с ней. Тогда наш слушатель сможет связать ваши данные со своей реальной жизнью и применить их в работе.

Важно. Текстовое описание (как и видео) тоже не является реальностью данных. Это просто еще один способ ее зафиксировать. Настоящая живая картина всегда больше любой фиксации.

Что же мешает качественно отображать реальность данных? Прежде всего, это фактор лжи. Давайте разберемся, что это такое.

Фактор лжи – это такое представление данных, когда то, что видит зритель, не соответствует тому, что есть на самом деле. Есть два типа фактора лжи: осознанный и неосознанный.

Осознанный фактор лжи появляется, когда человек сознательно визуализирует данные так, что они искажают реальность.

Пример. По факту: продажи падают, посещаемость сайта растет, но медленно.

Рисунок 1

Осознанно сузили, отрезали и раздвинули график, и визуально воспринимается, что посещение сайта активно растет, а продажи, как минимум, держатся на одном уровне (рис. 1).

Вот пример фактора лжи на пай-чарте. Какой сектор самый большой?

По факту – продукт 4. Визуально – продукт 8.

Так получается потому, что объемность смещает фокус внимания, искажает сообщение и вводит в заблуждение зрителя.

Еще один пример – на гистограмме.

Из фактора лжи: верхний и нижний график по объему выглядят равнозначно, и визуально считывается, что объем одинаковый, а на самом деле объем роликов несопоставим – по Сбербанку 600, по «Альфа-Банку» 300.

Важно. Если вы показываете несколько диаграмм на одном слайде, то убедитесь, что у всех них одинаковый масштаб шкалы.

Шаг 3. Выбрать диаграмму.

Итак, задача визуализации поставлена, реальность данных описана. Теперь нужно выбрать способ визуализации, то есть определить, какая диаграмма подойдет для ваших целей лучше всего.

Как выбрать диаграмму? В первую очередь, стоит ответить на вопрос, что вы хотите показать. Есть четыре стандартных варианта. Они представлены на схеме ниже.

После того как вы поняли, на какой вопрос вы хотите дать ответ, можно переходить к выбору диаграммы. В этом вам поможет следующая схема. Это краткий вариант алгоритма выбора диаграммы. Далее в этой главе вы найдете расширенную версию.

Типы данных

Итак, с помощью двух схем, которые приведены выше, вы можете сделать первые шаги к выбору подходящей диаграммы. Однако останавливаться на этом не стоит. Для того чтобы правильно выбрать диаграмму, важно понимать, данными какого типа вы располагаете. Их существует два типа: непрерывные и категориальные. Чем же они различаются?

Непрерывные данные – такие, значения которых могут иметь различные показатели в некотором интервале (например, вес, ширина, объем, величина брака и т. д.).

Категориальные данные представляют собой набор нечисловых значений, качественно характеризуют исследуемый процесс или объект и показывают, к какой категории относится каждый из рассматриваемых объектов. Обычно они не имеют количественного выражения (например, названия городов, наименования товаров, ФИО сотрудников и клиентов, пол, должность, название отдела и т. д.).

В некоторых случаях могут использоваться кодирующие эти категории числа.

Разные диаграммы строятся на основе данных одного типа. Например, если у вас непрерывные данные, то вы можете построить линейную диаграмму, а если дискретные, то рейтинг, точечную диаграмму и пай-чарт.

Ниже представлена расширенная версия схемы выбора диаграммы, которая учитывает тип данных, статика это или динамика, сложность построения диаграммы.

Рассмотрим конкретные примеры диаграмм. В этой главе вы познакомитесь подробнее с одной привычной диаграммой (круговой) и тремя более редкими (каскадной, диаграммой Дельта и диаграммой санкей).

Круговая диаграмма

Диаграмма круговая (пай-чарт) – способ графического изображения структуры, состава данных. Круг наглядно выражает всю совокупность, целое. Относительная величина каждого значения изображается в виде сектора круга, площадь которого соответствует вкладу этого значения в сумму значений. Сумма значений секторов всегда должна быть равна 100 % или целому значению.

Пай-чарт внешне похож на пирог, который нарезан на кусочки. С его помощью удобно показывать, как общий объем распределяется на части по определенному критерию. Например, так можно показать распределение населения России по разным возрастным группам.

Круговую диаграмму стоит использовать, когда количество частей целого, секторов, не больше пяти. Если их будет больше, то станет сложно увидеть различия между частями. Представьте, как и с пирогом: если его разрезать на 20 тоненьких кусочков, то сложно будет выбрать самый большой из них.

Если вернуться к примеру про распределение населения России по возрастным группам, то пай-чарт будет нагляден, если это будут крупные группы: например, 0–18, 18–36, 36–50, 50–65, 65 и старше. Если же нам нужно посмотреть, как распределено население по каждому возрасту: 0, 1, 2, и т. д., то лучше использовать столбиковую диаграмму.

Как вы уже поняли, недостаток пай-чарта – невозможность отразить множество категорий.

Несмотря на популярность пай-чарта, часто он не помогает эффективной визуализации, потому что используется некорректно.

Познакомимся с самыми частыми ошибками при использовании круговых диаграмм.

1. Попытка показать на пай-чарте сектор с отрицательным значением. Пай-чарт – это изображение целого и его составных частей. Все значения должны быть положительные, потому что в целом не может быть «минус сколько-то».

Перейти на страницу: