Часто графики, основанные на данных, предназначены не для того, чтобы анализировать, а для того, чтобы описывать то, что является их содержанием. Но что именно превращает графики в инструмент для коммуникации? И могут ли аналитическая и описательная функция графика быть разделены или контролироваться авторами?
Аналитические и описательные графики
Существует непрерывная связь между аналитической и описательной функциями графиковВ 1979 году Стефен Фьенберг (Stephen Fienberg) в своей работе ‘Graphical methods in statistics’ формализует идею о функциональном континууме между аналитическим и описательным графиками, являющимися противоположными пределами данного континуума. Таким образом, существует непрерывная связь между аналитической и описательной функциями графиков: не существует исключительно аналитических или исключительно описательных графиков. Кроме того, один и тот же график может иметь различные функции: быть источником информации для читателей и инструментом для исследования и анализа для автора.
Но, тем не менее, в зависимости от типа графика, он может быть эффективнее использован для анализа или описания. Например, линейные графики – самые популярные, согласно Эдварду Тафти (Edward Tufte), – и гистограммы, как правило, используются для того, чтобы описывать. То же самое можно сказать и о круговых диаграммах.
Точечные же диаграммы, наоборот, выходят за рамки описания и дают читателю возможность анализировать данные на исследовательском уровне.
Такие графики позволяют «видеть то, что может происходить за пределами уже описанного» [Cleveland and McGill, 1984]. Другими словами, это скорее аналитические графики.
Независимо от формы, графики, которые используются вместо таблиц, носят в основном описательную функциюВ то время, как форма представления информации определяет ее сложность, это не единственный фактор, влияющий на позицию графика в континууме «аналитический» — «дескриптивный». Независимо от формы, графики, которые используются вместо таблиц, носят в основном описательную функцию [Tukey, 1988]. Тип и количество информации, представленной на графике, также влияет на возможность его анализа.
Существует разница между визуальными элементами графика (например, линии графика), значимыми данными, выделенными на графике (например, детали, касающиеся одной точки), и всем набором данных, который использовался для создания графика. Все эти компоненты и их представление варьируют от графика к графику.
На гистограммах обычно представлен базовый набор информации, и они, как правило, эффективно используются в телевизионном вещании, исследовательских проектах, докладах и статьях. Гистограммы являются одним из самых простых способов визуализации данных, и для понимания содержания таких графиков, как правило, не требуется много времени.
С другой стороны, в аналитических графиках содержится больше данных, которые читателям необходимо изучить для понимания представленной информации. По словам Тафти, они «поощряют читателя сравнивать разные данные» — анализировать взаимосвязь точек, линий и областей графика.
Графики упрощают процесс коммуникации с читателями, но плохой дизайн легко может сделать данные непонятными и их значение не очевидным даже для самых внимательных читателей.
График должен давать читателям возможность сформировать свое собственное мнение и поднимать новые вопросы по данной тематике. Это основная причина, по которой графики должны нести функцию коммуникации — чтобы донести информацию от автора к читателю, вызывать интерес, содействовать появлению нового знания.
Инструменты
С пониманием потенциала графиков в представлении данных стали появляться соответствующие инструменты для создания графиков. В настоящий момент существует множество различных статистических программ, графических редакторов и веб-приложений, позволяющих быстро создавать графики. О них можно подробно узнать в статье «Набор инструментов для построения графиков, блок-схем и диаграмм» на Хабрахабре.
При этом особое внимание уделяется возможности изменять визуальный вид графика: пропорции и позиции. Именно визуальное представление влияет на восприятие, и одна и та же информация может быть воспринята по-разному в зависимости от графика. Например, сжав время на графике, можно получить более драматическую картину ценовых изменений.
Таким образом, эффективность графика зависит от разных составляющих, а не только от типа графика: это сочетание логики, эстетики и значения. Этого можно добиться, во-первых, используя различные статистические методы анализа данных для получения значимого сообщения, а во-вторых, применяя эстетические элементы для привлечения читателей и создания для них некоторой подсказки, как именно читать данные.
график должен «заставить читателя в первую очередь думать о содержании, а не о методологии, графическом дизайне, технологии или чем-то еще»
В результате всего этого график должен «заставить читателя в первую очередь думать о содержании, а не о методологии, графическом дизайне, технологии или чем-то еще», считает Тафти. Также данные, представленные на графике, должны быть важными и интересными, как для автора, так и для читателей: «если данные скучные, у вас неправильные данные» [Tufte, 1983].
Перегруженность информацией и подготовка читателя
Количество данных на графике – это, безусловно, выбор автора, но нужно помнить о том, что, в целом, графики, содержащие много данных, выглядят более надежными. Но даже независимо от количества данных график может оказаться сложным для восприятия, если читатель видит такой тип графика впервые [Kosslyn 2006]. В таких случаях, когда используются не самые распространенные типы графиков, имеет смысл не перегружать график данными. Данные можно добавлять на график после того, как аудитория запомнила такой способ представления информации. После этого данный тип графика можно использовать для отображения более сложных данных. Если же сразу нужно отобразить на графике большой набор данных или это единичный случай, то лучше прибегнуть к знакомым всем типам графиков, например, гистограмме или круговой диаграмме.
Имеет график значение или нет — напрямую зависит от способности читателя его понять и его знакомства с конкретным типом графика (что сильно отличается у разных людей). Таким образом, эффективность графического способа представления информации связана с графической грамотностью общества. То, что определенные типы графиков хорошо знакомы большинству людей, может стать отправной точкой для авторов: они могут начинать с простых графиков, постепенно добавляя более сложные элементы. Здесь приходится сталкиваться с поиском баланса между традицией и инновацией: ценой инноваций в графиках является их эффективность, но постоянное использование знакомых всем типов ведет к стагнации.
Компромиссом в этой ситуации будет постепенное введение новых элементов, что уважительно к читателям, которые не должны чувствовать себя ни умственно отсталыми, ни так, как будто их заставляют становиться аналитиками данных.
Иными словами – инновации нужны, но в умеренных дозах. Не следует так же слишком увлекаться сложными и абстрактными представлениями данных, которые создают фетиши в инфографике и представляют собой инфографический нарциссизм.
Один из способов введения инноваций – это представление новых графических форм в сопровождении подробных инструкций, объясняющих методы создания графика и то, как его следует читать.
Так же инфографику можно рассматривать с дарвинистской точки зрения: если определенный график прошел испытание временем и стал популярным, возможно, он является лучшим способом представления данного типа информации.
Выбор графика
При выборе типа графика, наиболее подходящего к имеющимся данным, нужно учитывать три фактора: соответствие контексту, в котором будет находиться график, — образование и культурный уровень потенциальных читателей.
Например, гистограмма – один из самых распространенных типов графиков для больших данных, хотя круговая диаграмма может выполнять ту же функцию. Но, согласно эмпирическим исследованиям, то, почему один тип графиков более популярный, — это не только вопрос вкуса, но и во многом зависит от эффективности графика.
Кливленд и МакГилл (Cleveland и McGill) в своем исследовании продемонстрировали, что круговая диаграмма заставляет читателей сильнее ошибаться в оценке разницы между двумя представленными группами данных, чем гистограмма. Читатели постоянно недооценивали разницу между секторами круговой диаграммы, в то время как искажение в восприятии было незначительным, когда данные были представлены в виде полосок гистограммы.
Правило, общее для всех графиков, — визуальное восприятие должно быть настолько простым, насколько это возможно. Цвета и градиенты, используемые вместо геометрических особенностей графика (длинна, объем и т.д.) увеличивают риск искажения восприятия [Cleveland and McGill, 1984].
Таким образом, использование графиков, соответствующих имеющимся данным и конкретной ситуации, поможет сделать процесс коммуникации наиболее эффективным.
Источники:
- Kosslyn S.M. Graph design for the eye and mind, Oxford University Press, 2006.
- Fienberg S.E. Graphical methods in statistics, The American Statistician, Vol. XXXIII, No. 4, p. 165-178, American Statistical Association, 1979.
- Tufte E.R. The visual display of quantitative information, Graphics Press, 1983.
- Tukey J.W. Some graphics and semigraphics displays, in Cleveland W. S., The collected works of John W. Tukey, p. 37-62, Pacific Grove, Wadsworth & Brooks, 1988.
- Tufte E.R. Envisioning information, Graphics Press, 1990.
- Kosslyn S.M. Graphics and human information processing, Journal of the American Statistical Association, Vol. LXX, No. 391, p. 499-512, 1985.
- Cleveland W.S. and McGill R. Graphical perception: theory, experimentation, and application to the development of graphical methods, Journal of the American Statistical Association, No. 79, p. 531-554, 1984.