В сюжете, с которого начинается эта глава, вас просили определить, какая из двух программ лечения с большей вероятностью поможет вам отвыкнуть от героиновой зависимости. В этом примере две переменные - тип лечения, который является независимой переменной, т. е. вы можете его выбирать (программа 1 или программа 2), и излечение, которое является зависимой переменной, т. е. вы считаете, что эта переменная изменяется в зависимости от типа лечения вы либо а) излечитесь от наркомании, либо б) не излечитесь от наркомании. Вы хотите выбрать программу, которая поможет вам излечиться. В терминологии проверки гипотез вы хотите знать, какое значение независимой переменной благоприятно повлияет на зависимую переменную.
Следующим этапом процесса проверки гипотез является введение рабочих определений переменных. Предположим, что мы решили определить «излечение» как воздержание от наркотиков в течение минимум двух лет, а «неизлечение» - как воздержание от наркотиков в течение периода менее двух лет, куда входит и случай, если вы будете продолжать постоянно употреблять наркотики. Важно критически обдумать рабочие определения ваших переменных. Если они сформулированы неудовлетворительно, то заключение, к которому вы придете в результате своего исследования, может быть неправильным.
Чувствительность измерений
При измерении какой-либо величины мы постоянно придаем ей числовые значения, чтобы получить ее количественную характеристику. Рост человека, который выше вас, обозначается большим числом дюймов, чем ваш рост. Иначе понятие роста потеряло бы смысл.
Когда мы мыслим, как ученые, и собираем информацию, чтобы понять устройство мира, нам необходимо учитывать способ измерения переменных. Предположим, вы считаете, что любовь напоминает лихорадку и что у влюбленных бывают симптомы, похожие на симптомы лихорадки. Чтобы выяснить, верно ли это, вы можете провести эксперимент, измерив температуру у влюбленных и сравнив результаты с температурой людей, которые не влюблены. Как вы будете измерять температуру? Предположим, вы решили пользоваться ленточным термометром, который регистрирует температуру, когда его помещают на лоб пациента. Далее предположим, что этот прибор измеряет температуру, округляя ее до целых градусов (например, 36°, 37°, 38° и т. д.). Если от любви температура тела действительно повышается, но только на полградуса, вы этого никогда не узнаете, пользуясь ленточным термометром. Такие термометры просто недостаточно чувствительны для того, чтобы зарегистрировать небольшие отклонения температуры тела. Вы придете к неправильному заключению о том, что любовь не приводит к повышению температуры тела, хотя на самом деле это может быть не так. Насколько мне известно, подобный эксперимент никогда не проводился, но он хорошо демонстрирует необходимость учета чувствительности измерений в этой и других ситуациях.
Контингент и выборки
Каждый день люди принимают огромное количество решений, касающихся жизни и деятельности других людей Эти решения неизбежно чреваты ошибками, которые возникают из-за невежества, личных предубеждений или стереотипов
У Грант Дальстром (Dahlstrom, 1993, р 393)
Принимая решение о том, какую программу лечения от героиновой зависимости выбрать, или в каком колледже учиться, или на какую работу устроиться, вы делаете ставку на будущее событие, которое неизбежно связано с неопределенностью. Принципы проверки гипотез применяются для уменьшения этой неопределенности. Мы не можем полностью устранить неопределенность, но мы можем воспользоваться принципами проверки гипотез, которые помогут нам сделать оптимальный выбор. В примере, с которого я начала эту главу, вам пришлось бы изучить и оценить информацию о степени успешности обеих программ. Затем вы воспользовались бы этой информацией для принятия решения.
Группа людей, о которой мы хотим получить данные, называется контингентом. Поскольку очевидно, что для выявления более успешной программы лечения мы не можем обследовать всех людей, страдающих от героиновой зависимости, нам придется обследовать подгруппу этого контингента. Такая подгруппа называется выборкой. В данном примере выборку составляют все люди, которые лечились по каждой из программ.
Репрезентативные и нерепрезентативные (тенденциозные) выборки
Мы хотим, чтобы выборка была репрезентативной для нашего контингента. Чтобы выборка была репрезентативной, входящие в нее наркоманы должны быть мужчинами и женщинами из всех социально-экономических слоев общества, иметь различные уровни интеллекта, проживать в городских и сельских районах и т.д. Репрезентативная выборка необходима для того, чтобы можно было обобщить полученные результаты и решить, какая из программ в целом успешнее. Обобщением называется распространение результатов, полученных на выборке, на весь контингент, т.е. мы подразумеваем, что при обследовании всего контингента получили бы аналогичные результаты.
Что происходит, если выборка не репрезентативна для контингента? Предположим, что одна из программ стоит очень дорого, а другая программа предназначена для бедных и субсидируется государством. Это примеры нерепрезентативных (тенденциозных) выборок. Поскольку они не репрезентативны, вы не можете пользоваться ими для того, чтобы делать выводы обо всем контингенте наркоманов, употребляющих героин
Самое большое фиаско во всей истории выборок произошло, по-видимому, в 1936 г., когда журнал «Литературный дайджест» разослал по домашним адресам более 10 миллионов бюллетеней, чтобы предсказать результаты выборов президента, которые должны были состояться в том же году (Kimble, 1978). На этой большой выборке были получены совершенно ясные результаты: следующим президентом будет Альф Лэндон. Что, вы не знаете такого президента? Я уверена, что не знаете, потому что президентом США в 1936 г был избран Франклин Делано Рузвельт. В чем же было дело? Проблема состояла в том, как были отобраны избиратели, вошедшие в выборку. Бюллетени рассылались подписчикам этого литературного журнала, людям, чьи адреса были в телефонной книге, и владельцам автомобилей. Напоминаю, что дело было в 1936 г., когда только состоятельные люди подписывались на журналы и имели телефоны или автомобили. В выборку не было включено большое число менее богатых избирателей, многие из которых голосовали за Рузвельта, а не за Лэндона. Поскольку выборка была нерепрезентативной, нельзя было обобщать результаты на весь контингент. Несмотря на то, что в выборку было включено большое количество избирателей, результаты оказались неправильными, поскольку она была нерепрезентативной.
Часто бывает нелегко заметить, какое глубокое влияние оказывают нерепрезентативные выборки на получаемую нами информацию. Например, пользуются большой популярностью (возможно, потому, что кто-то зарабатывает деньги на оплате телефонных разговоров) телефонные опросы, в которых респонденты сами звонят, чтобы ответить на заданный вопрос. Предположим, телефонный опрос показал, что 75% респондентов, позвонивших, чтобы выразить свое мнение о смертной казни, были против нее. Какие выводы можно сделать из этого? Абсолютно никаких! Опросы такого типа называются slops (selected listeners opinion polls), что означает «опрос мнений избранных слушателей», а также отражает их ценность (slops по-английски также означает «помои»). Только люди с крайними взглядами по какому-либо вопросу не пожалеют времени и денег на то, чтобы позвонить и выразить свое мнение. Хотя обычно перед этими опросами предупреждают, что «это не научные данные», комментатор затем переходит к изложению бессмысленных результатов, как будто они отражают общественное мнение.
Еще одной ловушкой при составлении выборки является возможность смешанного влияния факторов (confounding). Поскольку пациенты этих двух гипотетических программ лечения от героиновой наркомании отличаются между собой по нескольким признакам, - т. е. по первой программе консультации проводят ровесники, а наркоманы очень состоятельны, а по второй программе предлагается лечение другого типа, и пациенты очень бедны, - мы не можем определить, зависят ли различия в показателях выздоровления от типа лечения или от уровня доходов пациентов. Поскольку мы не можем разделить влияние типа лечения и уровня доходов пациентов, то по этим результатам нельзя судить о том, какой тип лечения успешнее.
Обычно ученые пользуются удобными (convenience) выборками. Они исследуют группу людей, которые легко доступны. Чаще всего участниками психологических экспериментов бывают студенты колледжей и крысы. Насколько широко можно обобщать результаты, полученные на этих выборках, зависит от того, какой вопрос вы исследуете. Если вы хотите понять, как работает человеческое зрение, студенты колледжа будут подходящими участниками, особенно если вас интересуют молодые и здоровые глаза. С другой стороны, если вы хотите разобраться в вопросе о стереотипизации половых ролей у взрослых, студенты колледжа не будут репрезентативной выборкой, поскольку по сравнению с другими взрослыми они менее склонны к стереотипизации. В этом случае вы можете обобщать результаты только на студентов колледжа.