раз в тот момент, когда мы с вами пили чай и мирно беседовали. Однако вероятность этого события столь мала, что любая дополнительная информация существенно не изменит ваше мнение. Свиньи так редко падают с крыш домов в городе, что даже фото этого события можно рассматривать как жульничество или розыгрыш, но никак не доказательство.
Теперь понятно, почему даже положительный результат диагностики не должен был кардинальным образом изменить мнение Елены о том, больна она или нет. Ведь болезнь редкая! Настолько редкая, что даже неоспоримый, казалось бы, факт не является решающим. Как мы убедимся дальше, вероятность того, что Елена действительно больна, менее 10 %.
Чтобы понять, как мы вышли на эту цифру, обратимся к преподобному Томасу Байесу.
Расчет вероятности редких событий
Томас Байес (1702–1761), английский математик, священник, автор формулы для расчета вероятности с учетом экспериментальных наблюдений, оставил после себя всего две книги. Первая, большая, сразу стала очень популярной. В ней Байес рассуждал о том, что и сегодня многим не дает спокойно спать, а именно – почему Бог, если он есть, допускает страдания и убийства ни в чем не повинных людей.
Вторая книга, небольшая, вначале мало кому показалась заслуживающей внимания, тем более что в ней были достаточно сложные формулы. В этой книжке Байес дал ответ на вопрос, как новые факты меняют наше первоначальное мнение о вероятности того или иного события. Или как новое условие (положительный результат диагностики) повлияет на нашу оценку вероятности заболеть редкой болезнью. С тех пор такая условная вероятность носит название байесовой.
Мы не будем здесь приводить формулу условной вероятности. Вместо нее давайте построим матрицу рассуждений, которая даст ответ на поставленный в начале главы вопрос: какова вероятность того, что Елена все же болеет той самой редкой болезнью.
Предположим, что мы случайным образом отобрали 10 000 человек. Нам известно, что болезнь эта крайне редкая и вероятность заболеть не превышает 0,8 %. Это означает, что из 10 000 только 80 человек априори больны, а оставшиеся 9920 здоровы (нижняя строчка матрицы).
По вертикали в нашей матрице будут два столбца: больные и здоровые. Как мы уже выяснили, всего больных 80, здоровых 9920. По горизонтали – результаты диагностики (положительный и отрицательный). Сколько людей, у которых положительный результат, реально больны? Если бы аппаратура никогда не ошибалась, то этот вопрос не имел бы смысла. Однако со слов врача мы знаем, что вероятность правильной диагностики не 100 %, а только 90 %.
90 % от 80 – это 72. Соответственно, оставшиеся 8 человек имеют отрицательный результат диагностики, но все же больны (первый столбец матрицы).
Смотрим далее. Сколько здоровых людей получили положительный результат диагностики? Ответ во втором столбце матрицы. Опять же, со слов врача мы знаем, что если болезни нет, то диагностика ошибочно покажет ее с вероятностью 7 %. А 7 % от 9920 – это 694. Оставшиеся 9226 людей не болеют и имеют отрицательный результат.
Таким образом, получается, что по причине несовершенства диагностической аппаратуры лишь 72 человека из 766, имеющих положительный результат, реально болеют. А 72 из 766 – это примерно 9,4 %. Таким образом, даже при положительном результате вероятность того, что вы больны, менее 10 %. Причина – очень низкое значение априорной вероятности (0,8 %).
Поэтому решение, которое приняла Елена, оказалось правильным. Низкая априорная вероятность означает, что шансов заболеть этой болезнью крайне мало, и даже положительный результат диагностики повышает эти шансы лишь до 9,4 %.
Итак, если априорная вероятность маленькая, это означает, что, скорее всего, данное событие не произойдет, а наша чересчур эмоциональная реакция вызвана доверчивой и падкой на яркие события Системой 1. Когда в США в 2001 году самолеты врезались в башни-близнецы и погибли тысячи людей, многие американцы отказались от путешествий на самолетах и пересели на автомобили. Как результат, в первый же год в ДТП погибло людей больше, чем унесла катастрофа 11 сентября.
Редкие события на то и редкие, что не стоит тратить ресурсы и время на их профилактику и постоянное обдумывание. Вместо того чтобы беспокоиться о редких событиях, лучше сфокусироваться на чем-то более реальном, на что мы можем оказать влияние.
Понимание априорной вероятности поможет вам не только правильно оценить вероятность редких событий, но и защититься от статистических манипуляций. Нас часто пугают страшными последствиями событий, имеющих призрачные шансы случиться. И наша доверчивая Система 1, опасаясь их, принимает нерациональные решения. Чтобы убедиться в этом, предлагаю решить следующую задачу.
Задание
Представьте, что вам надо купить систему видеонаблюдения. Менеджер по продажам сообщает, что 60 % всех раскрываемых домовых краж раскрываются благодаря системе видеонаблюдения. И менеджер прав, статистика именно такова.
Перед тем как принять решение, вы собрали следующую информацию:
Половина всех домов имеет видеонаблюдение.
Вероятность кражи имущества из дома составляет 1,7 %.
Раскрываемость краж в стране примерно равна 37 %.
Какова вероятность, что покупка системы видеонаблюдения поможет вам в поимке преступников? При ответе на этот вопрос рекомендую воспользоваться матрицей, которую мы заполнили для предыдущего примера. Подсказка: данная задача сложнее, чем та, которую мы решали, и, возможно, она решается не в одно действие.
Условия для выполнения задания:
● Вы можете пользоваться интернетом, если вам не хватает какой-либо информации.
● Как и в жизни, в этой задаче могут быть лишние данные.
Резюме
● Априорная вероятность – это вероятность, которая известна до получения опыта.
● Новая информация меняет априорную вероятность лишь незначительно.
● Редкие события потому и редкие, что имеют невысокую априорную вероятность.
● Понимание априорной вероятности позволяет правильно оценить вероятность редких событий, сфокусировать ресурсы на круге влияния, а также защититься от статистических манипуляций.
Вариант решения задания
Возьмем 1000 домов. Так как вероятность кражи 1,7 %,