ГИСТОГРАММА
В вышеназванных целях данный тип сравнения лучше всего иллюстрировать с помощью ступенчатых гистограмм или графиков. Гистограммы нагляднее, когда используется не больше 5–7 областей числовых значений, в противном случае удобнее будет график.
ГРАФИК
Эти типы диаграмм содержат две шкалы: вертикальную (частотности), где указывается количество (иногда в процентах) анализируемых элементов или явлений, и горизонтальную (распределения) для диапазонов. Шкала распределения требует особого внимания.
Размер диапазонов. Размер и количество диапазонов весьма важны для демонстрации модели распределения. Слишком малое количество не позволяет проследить модель, а слишком большое – разбивает ее на мелкие части. Как правило, применяется не менее пяти, но не более двадцати областей числовых значений. При этом размеры диапазонов должны нагляднее всего демонстрировать вашу основную мысль. Обратимся к конкретному примеру. Допустим, мы хотим создать модель распределения среднегодовых заработков учителей государственных школ в пятидесяти штатах.
При использовании диапазона в 500 долл. проследить зависимость не удается.
Если мы увеличим размер диапазона до 1 тыс. долл., модель начинает вырисовываться.
Но лишь при использовании дипазона в 2 тыс. долл. мы получаем наглядную модель. Здесь мы ясно видим колоко-лообразную кривую, которая обычно изображает частотное распределение. Кривая сдвинута влево, то есть к низшей стороне распределения. Это иллюстрирует основную идею: почти в половине штатов (в 23 из 50) учителям платят менее 16 тыс. долл. в год.
Размер интервалов. Лучше всего использовать интервалы одинакового размера. Если один интервал отражает разницу в 5 долл., а другой – в 20, кривая распределения получится искаженной. Исключением из этого правила являются случаи, когда информация фиксируется в неравных диапазонах (например, уровни образования) или когда неравные интервалы помогают лучше усвоить информацию (как в случае с разбросом подоходного налога). Разброс доходов настолько велик, что близко к низшей точке оказывается слишком много людей, а к высшей – слишком мало. Поэтому равные интервалы здесь применять нельзя. При использовании интервалов по 1 тыс. долл. придется чертить диаграмму в несколько метров шириной, а при интервалах по 40 тыс. долл. практически все население окажется в пределах первого интервала. Диаграмма будет наиболее информативной, если более мелкие интервалы использовать ближе к низшей точке, а более крупные – ближе к высшей.
Четкие границы. Размеры интервалов должны быть четко обозначены. «Перекрывающиеся» границы (0—10, 10–20, 20–30) не объясняют, к каким интервалам относятся цифры, повторяющиеся по два раза (10, 20). Для непрерывных величин (например, объемов продаж в долларах) предпочтительнее всего следующие границы – менее 10,00 долл., 10,00–19,99 долл., 20,00–29,99 долл. и т. д. Для дискретных величин (количество произведенных автомобилей и т. п.) – менее 10, 10–19, 20–29 и т. д.
И гистограммы, и графики можно совмещать. Например, для того, чтобы сравнить данные по двум разным годам или сопоставить возрастной состав сотрудников вашей компании и компаний-конкурентов или в отрасли в целом. Кроме того, при иллюстрации конкретных величин можно применять диаграммы с накоплением, чтобы показать вклад каждого параметра в общую сумму[Внимание! Нельзя применять диаграммы с накоплением, когда частота распределения выражена в процентах. Например, если от 5 до 10 долл. в час зарабатывают 60 % женщин и 50 % мужчин, нельзя сказать, что в целом 110 % населения зарабатывают от 5 до 10 долл. в час.].
5. Корреляционное сравнение
Корреляционное сравнение показывает, соответствует ли соотношение двух переменных ожидаемой зависимости. Например, обычно можно ожидать, что более опытный продавец работает эффективнее, чем менее опытный, или что люди с более высоким уровнем образования получают более высокую стартовую заработную плату. Подобные сравнения лучше всего иллюстрируются при помощи точечных (рассеянных) или двусторонних линейчатых диаграмм. Рассмотрим каждый из этих вариантов.
На этой диаграмме мы показываем 16 сделок с точки зрения размера скидок и количества единиц проданного товара. Обычно ожидается, что чем больше скидка, тем выше стимул купить больше товара. Но, как показывает точечная диаграмма, в данном случае подобной корреляции нет.
Точечная диаграмма
Взгляните, к примеру, на точки А и Б, обозначающие сделки, совершенные двумя продавцами. Оба продали по 20 единиц товара (горизонтальная шкала). Однако А предлагал 7-долларовую скидку, тогда как скидка у Б составляла всего 4 доллара (вертикальная шкала). С другой стороны, продавцы В и Г предлагали одинаковую скидку в 3 доллара, но В продал 30 единиц, а Г — в два раза больше. Как видно, размер предлагаемой скидки слабо влиял или вообще не влиял на объемы продаж.
Если бы между этими параметрами существовала статистически значимая связь (корреляция), точки концентрировались бы вдоль диагональной линии, идущей от левого нижнего угла диаграммы к правому верхнему, что на рисунке показано стрелкой. Подобные стрелки удобно использовать для обозначения предполагаемой модели развития событий. Стрелка может быть направлена вниз, когда вы хотите показать, что объемы продаж возрастают со снижением цен. Не следует путать такую стрелку с математически вычисляемой «линией тренда» – кривой, которая показывает тенденцию изменения величины.
Подобные точечные диаграммы сейчас все шире используются в презентациях, докладах и некоторых деловых журналах. Если вы также собираетесь их применить, позаботьтесь о своих слушателях или читателях и сначала объясните, как читать такой тип диаграммы.
Еще одна проблема, связанная с данным типом диаграмм, – это обозначение точек. Если под каждой точкой подписывать, скажем, имя продавца, это может не только запутать читателя, но и повредить его зрению. Приемлемый вариант – обозначать точки буквами или цифрами, которые соотносятся с полными именами или названиями, приведенными в легенде. Более правильный вариант – использовать двустороннюю линейчатую диаграмму.
Линейчатая диаграмма
Как видно, при использовании двусторонней линейчатой диаграммы наименование каждого ряда величин, нанесенных на диаграмму, можно вписать между двумя рядами линеек. Кроме того, в таких диаграммах независимые переменные обычно располагают слева – от меньшего значения к большему или наоборот. Если ожидаемая и реальная зависимости совпадают, то линейки справа, обозначающие зависимые переменные, будут зеркальным отражением независимых. Другими словами, низким скидкам будет соответствовать небольшой объем продаж, а высоким – большой. Если же реальная зависимость не соответствует ожидаемой, то два столбца будут отличаться друг от друга, как в приведенном примере.