На самом деле очень плохо.
Самая распространенная ошибка в решении этой задачи — полагаться исключительно на графу «да/присутствует». «Да, этот симптом связан с этой болезнью. У некоторых людей с симптомом X обнаружена эта болезнь». Тенденция к выражению такого рода мнения является примером необъективности подтверждения — склонности искать доказательства, которые подтвердят уже имеющуюся гипотезу, не учитывая при этом тех доказательств, которые могут эту гипотезу опровергнуть.
Другие, взглянув на таблицу, обращают внимание на две графы. Кое-кто делает вывод, что симптом связан с этой болезнью, «потому что людей, имеющих этот симптом и страдающих этой болезнью, больше, чем людей, имеющих этот симптом и не болеющих этой болезнью». Другие делают вывод, что симптом не связан с болезнью, «потому что среди страдающих этой болезнью людей больше тех, кто не имеет этого симптома, чем тех, кто его имеет».
Не имея представления о статистике как науке, мало кто понимает, что нужно принимать во внимание все четыре графы таблицы, чтобы суметь ответить на простой вопрос о связи между этими двумя явлениями.
Нужно составить пропорцию для сравнения количества людей, у которых диагностировали данное заболевание в сочетании с данным симптомом, и количества людей, у которых обнаружили данную болезнь, но не этот конкретный симптом. Затем вы составляете пропорцию для сравнения количества людей, у которых нет данного заболевания, но есть этот симптом, и количества людей, у которых нет заболевания и нет симптома. Так как в результате получаются две одинаковые пропорции, мы понимаем, что этот симптом ничуть не больше связан с этой болезнью, чем с ее отсутствием.
Вас, наверное, встревожит тот факт, что большинство людей, включая врачей и медсестер, которые ежедневно занимаются лечением болезней, как правило, затрудняются дать правильный ответ при изучении таких данных, как приведенные в таблице 3[108]. К примеру, можно показать им таблицу, в которой отмечено, сколько больных некой болезнью выздоровели в результате определенного вида лечения, сколько не выздоровели, а также сколько больных выздоровели без этого лечения и не выздоровели без этого лечения. Врачи иногда могут предположить, что определенное лечение помогает больным, потому что из получивших его большее количество людей выздоровело, чем не выздоровело. Но, не зная соотношения этого количества людей с количеством выздоровевших без этого лечения и количеством людей, не выздоровевших без этого лечения, невозможно сделать верные выводы. В связи с этим такие таблицы иногда называют таблицы 2x2, или четырехпольные таблицы.
Существует статистический критерий, называемый хи-квадрат, который рассматривает вероятность того, что две пропорции достаточно отличаются друг от друга, чтобы можно было с уверенностью утверждать, что перед нами подлинная взаимосвязь явлений. Мы называем взаимосвязь подлинной, если разница между двумя пропорциями статистически значима.
Типичный критерий, на основе которого можно утверждать, значима связь или нет, формулируется так: показывает ли тест (хи-квадрат или любой другой статистический тест), что данная степень связи может оказаться случайной лишь в пяти случаях из ста. Если так, мы говорим, что уровень статистической значимости равен 0,05. Тест оценки значимости можно применять не только к дихотомическим данным (или/или), но и к непрерывным.
Когда мы имеем дело с непрерывными случайными величинами и хотим знать, насколько тесно они связаны одна с другой, мы применяем статистический метод корреляции. Возьмем две переменные величины, которые очевидно коррелируют между собой, — рост и вес. Конечно, связь между ними не абсолютная, потому что, как мы знаем, есть много примеров невысоких людей с относительно большим весом и, наоборот, высоких людей с относительно небольшим весом.
Статистические методы могут рассказать нам о том, насколько тесна связь между двумя величинами. Один из часто используемых методов исследования степени связи между непрерывными величинами называется методом корреляции смешанных моментов Пирсона. Корреляция, равная 0, означает, что между двумя величинами нет никакой связи. Корреляция, равная +1, означает, что между двумя величинами существует полная положительная связь, то есть если значение первой величины увеличивается, то значение второй величины увеличивается в соответствующей степени. Корреляция, равная -1, означает полную отрицательную связь.
Рис. 3. Диаграмма разброса и корреляции
На рисунке 3 с помощью так называемых диаграмм разброса показано, насколько велика корреляция такого масштаба. Отдельные графики называются диаграммами разброса, потому что они показывают степени разброса относительно прямой линии — полной функциональной связи.
Корреляцию, равную 0,3, трудно распознать визуально, но на практике она может быть очень важна. Корреляция уровня 0,3 соответствует, например, прогнозируемости уровня дохода в зависимости от IQ[109] или успеваемости в аспирантуре в зависимости от оценок в колледже[110]. В такой же степени можно спрогнозировать вероятность развития сердечно-сосудистых заболеваний в зависимости от веса человека.
Корреляция 0,3 это вовсе не пустяк — это значит, что если кто-то находится в 84-м процентиле (одно СКО выше среднего значения) переменной величины А, то этот человек скорее всего будет в 63-м процентиле по величине Б (0,3 СКО выше среднего значения). А это уже более высокая прогнозируемость для величины Б, чем та, что была у вас, когда вы ничего не знали о величине А. В этом случае вы должны догадаться, что 50-й процентиль для каждого — среднее значение распределения величины Б. Иногда такой факт может решить судьбу вашего бизнеса — будет он процветать или обанкротится.
Корреляция 0,5 соответствует степени связи между уровнем 1(2 и качеством исполнения служебных обязанностей на средней должности. (Корреляция в данном случае будет выше, когда работа сложная и ответственная, и ниже, когда работа более легкая.)
Корреляция 0,7 соответствует степени связи между ростом и весом — она существенна, но все же это не полная взаимосвязь. Корреляция 0,8 соответствует степени связи между баллами за тестирование знаний по математике за один год и баллами за этот же тест на следующий год — это довольно высокая корреляция, но все же разница между двумя оценками в среднем может быть велика.
Корреляция не означает наличие причинно-следственной связи
Расчет коэффициента корреляции — только один из шагов в определении причинно-следственных связей. Если между величиной А и величиной Б нет корреляции, тогда между ними (вероятно) нет и причинно-следственной связи. (Исключением может быть такой случай, когда существует третья величина В, которая маскирует корреляцию между А и Б, когда между ними на самом деле есть причинно-следственная связь.) Если между А и Б есть корреляция, это еще не говорит о том, что изменение величины А является причиной изменения величины Б. Возможно, А влияет на Б или Б влияет на А, а также ассоциация может возникнуть вследствие того, что А и Б связаны с некой третьей величиной В, но между А и Б нет никакой причинно-следственно связи.
Практически любой человек с высшим образованием признает, что теоретически эти утверждения верны. Но зачастую конкретная корреляция настолько согласуется с весьма правдоподобными объяснениями некой взаимообусловленности, что мы автоматически принимаем ее как доказательство наличия причинно-следственной связи. Нам так хорошо удается строить гипотезы о причинах и следствиях, что это происходит практически само собой. Выводы о причинах и следствиях, которые возникают у нас в голове, часто бывают настолько соблазнительны, что нам трудно от них отказаться. Если я скажу вам, что у людей, которые едят много шоколада, чаще бывают прыщи, трудно не сделать вывод, что шоколад вызывает появление прыщей. (Как известно, это не так.) Если я скажу вам, что пары, которые тщательно готовятся к свадьбе, потом дольше живут в браке, у вас возникнет естественный вопрос: каким же образом тщательно продуманная свадебная церемония продлевает брак? Не так давно в статье в одной очень известной газете автор утверждал, что такая корреляция существует, и пускался в размышления, почему совместная работа по планированию свадьбы производит такой эффект. Если поразмыслить над этой корреляцией, вы поймете, что тщательное планирование свадьбы не является случайным событием; скорее, можно сказать, что это событие с большей вероятностью произойдет у тех, у кого больше друзей, больше свободного времени друг для друга, больше денег и много чего еще. Любой из этих аспектов, а лучше сказать, все они и влияют на продолжительность брака. Не стоит выдергивать из запутанной паутины событий один-единственный факт и начинать раздумывать о том, как же так получилось. Это ни к чему не приведет.