Рациональная стратегия состоит в том, чтобы сосчитать все вероятности, возможные при этой комбинации, и поделить полученное число на общее количество возможных бросков. Если обозначить через 1 орла и через 0 решку, мы увидим, что возможны три сочетания, дающие два орла и решку:
110, 101, 011.
Для того чтобы вычислить вероятность, мы должны узнать общее количество возможных последовательностей, а именно:
111, 110, 101, 100, 011, 010, 001, 000,
то есть у нас есть восемь вариантов, три из которых соответствуют нужной последовательности. Вероятность получения двух орлов и одной решки равна 3/8.
Однако газ состоит не из трех, а из миллиардов частиц. Следуя аналогии с монетами, какова вероятность получить ровно 70 % орлов при двух миллионах бросков? В этом случае становится очевидным, что наш метод вычисления вероятностей не годится, и нам нужно разработать более мощный математический аппарат, который позволил бы нам легко рассчитать вероятность некоторого распределения результатов для любого количества бросков, то есть распределение вероятностей.
Как мы увидим, существуют различные варианты распределения вероятностей, и каждый из них имеет место в каждом отдельном случае. В данном случае нас интересует, что происходит с дискретной переменной — это означает, что мы имеем дело с отдельными результатами, такими как орел или решка. Существует другой тип переменных, называемых непрерывными, под которыми подразумевается любая величина в некотором диапазоне: например от 0 до 10, включая любое число с произвольным количеством знаков после запятой.
Для наших рассуждений важно знать факториальную функцию. Факториал 3 обозначается 3! и вычисляется следующим образом:
3! = 3·2·1.
5! = 5·4·3·2·1.
Факториал п вычисляется следующим образом:
n! = n·(n — 1)·(n — 2)·…·2·1.
Теперь мы можем начать выводить формулу, которая даст нам вероятность получения некоторой последовательности орлов и решек при любом количестве бросков.
Для начала посмотрим, сколько возможных комбинаций выпадения орла и решки существует для n бросков. Для первого броска возможны два варианта: орел или решка. Для второго — еще два, что в сумме дает четыре. Для следующего броска у нас есть по две возможности для каждого предыдущего, что в сумме дает восемь. Итак, общее число возможностей для n бросков равно 2n, то есть два, умноженное само на себя n раз.
Далее нам нужно вычислить количество комбинаций, при которых можно получить k орлов при n бросков. Подставляя различные числа, можно выяснить, что количество комбинаций задано биномиальным коэффициентом, который определяется по следующей формуле с использованием факториальной функции:
Вероятность выпадения k сторон, следовательно, равна разделенному на число комбинаций орлов и решек, которое, напомним, равно 2n. Поскольку в этом распределении вероятностей используется биномиальный коэффициент, оно известно как биномиальное распределение и может быть легко расширено на фальшивые монеты, где вероятность выпадения решки больше, чем орла, или наоборот.
Биномиальное распределение позволяет сделать прогнозы, которые, как кажется, противоречат здравому смыслу. Например, какова вероятность выпадения 50 орлов за 100 бросков? Применим нашу формулу, помня, что вероятность — это отношение к единице, а не к 100:
Этот результат может показаться удивительным, мы ведь ожидали 50 орлов на 100 бросков. Почему же вероятность получилась такой низкой? Ответ в том, что мы интересуемся вероятностью выпадения именно 50 орлов. Теперь найдем вероятность выпадения сорока девяти:
* * *
ПАРАДОКС МОНТИ ХОЛЛА
Парадокс Монти Холла — это применение теории вероятностей, противоречащее обычной интуиции. Представьте конкурс, когда игроку предлагается на выбор три двери, за одной из которых — ценный приз.
Конкурс состоит из двух частей: в первой части конкурсант выбирает дверь, но не открывает ее. При этом ведущий открывает одну из двух оставшихся дверей и показывает, что приза за ней нет. Во второй части конкурсант должен или сохранить свой первоначальный выбор, или изменить его на ту дверь, которую осталось открыть.
Большинство людей считают, что изменение выбора не имеет значения: вероятность того, что игрок выбрал правильную дверь, 50 %, поскольку есть две двери и приз. Однако это не так: лучшая стратегия — изменить выбор.
Объяснить это можно следующим образом: вероятность выбора правильной двери составляет одну треть. И после того, как ведущий убрал один из вариантов, вероятность того, что игрок выбрал правильную дверь, не изменилась: она по-прежнему равна одной трети. Но вероятность того, что приз за оставшейся дверью — 66 %.
Хотя люди считают эту проблему очень сложной, недавние эксперименты с голубями показали, что у этих птиц статистические способности выше, чем у нас, потому что после нескольких попыток они всегда выбирают смену двери.
* * *
Полученное число несколько меньше, но относительно высоко. Получаем, что вероятность выпадения 48 орлов равна 7,3 %. Следовательно, вероятность выпадения числа орлов между 48 и 52 равна:
Р = Р48 + Р49 + Р50 + Р51 + Р52 = Р50 + 2Р49 + 2Р48 = 7,9 + 2·7,8 + 2·7,3 = 38,1 %.
Распределение вероятностей максимально для 50 орлов и уменьшается по мере того, как мы отдаляемся от центра, что и показано на графике.
Биномиальное распределение для различного числа бросков (n) и вероятности получения орла (р).
Итак, хотя вероятность выпадения ровно 50 орлов невысока, мы можем быть достаточно уверены в том, что получим от 45 до 55 орлов. Этот способ рассуждения используется при проведении социальных опросов.
Предположим, что 50 % жителей страны проголосуют за определенного кандидата. Если мы проведем опрос тысячи людей, выбранных случайно, крайне маловероятно, что ровно 500 из них ответят, что проголосуют за этого кандидата. Однако гораздо более вероятно, что таким будет ответ от 450 до 550 опрошенных. Способ увериться в том, что опрос достоверный, — установить, между какими двумя величинами заключено 95 % вероятности получить необходимый результат.
Биномиальное распределение — это только одно из многочисленных дискретных распределений вероятностей. Кроме него, существует распределение вероятностей для непрерывных переменных, при котором нас интересует вероятность того, что какое-то значение находится в определенном диапазоне.
Самое известное непрерывное распределение вероятности — это распределение Гаусса, или нормальное распределение. Оно имеет форму колокола, как можно заметить на графике на стр. 74.
* * *
ДРУГИЕ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ
Другое широко используемое распределение — это геометрическое распределение. Как и в случае с биномиальным распределением, у нас есть случайное событие, такое как бросок кубика или монеты. Назовем успехом один из возможных вариантов, например выпадение орла. Какова вероятность того, что первый успех появится после к бросков, если его вероятность равна р?
Геометрическое распределение говорит, что эта вероятность вычисляется по
Р = (1 — р)k-1р,
что можно представить следующим образом.
Среди распределений вероятности, где переменная может принимать любое значение в определенном диапазоне, самое простое — равномерное распределение, при котором каждому событию просто назначается одна и та же вероятность, так что получается фигура, подобная этой.
* * *
Различные формы нормального распределения, согласно разным параметрам.
Нормальное распределение имеет большое значение как в статистике, так и в естественных и социальных науках, благодаря центральной предельной теореме. В ней говорится, что в некоторых условиях любая случайная переменная имеет тенденцию следовать нормальному распределению. Например, если мы будем измерять такую физическую величину, как скорость, наши результаты будут иметь тенденцию распределяться согласно фигуре, изображенной на графике, вокруг среднего значения. Именно использование этого распределения позволяет физикам определить границы доверия своим экспериментам: измерив площадь под кривой Гаусса, можно получить вероятность того, что результат измерения случаен.