Пусть при обследовании субъекта S были получены признаки v10, v20,…, Vn0 (они приведены здесь в порядке их убывающей информативности). Пусть на основании здравого смысла выбраны допустимые вероятности ошибок α и β. Рассмотрим отношение вероятностей, соответствующих первому признаку:
Если это отношение будет меньше, чем
то это будет означать, что полученное значение признака v10 настолько вероятнее для класса «А», что можно с выбранным уровнем надежности (α, β) утверждать, что данное лицо относится к классу «А» (пригодно к данной профессиональной деятельности). Если это отношение
то с тем же уровнем надежности принимается решение о непригодности к рассматриваемой деятельности. Если
то информация, заключенная в признаке, недостаточна для отнесения к классам «А» и «В» и рассматривается следующий признак v20.
Если
то выносится решение об отнесении индивида в класс «А»; если
то в класс «В».
Когда же
то рассматривается значение третьего признака v30 и т. д.
Если, перебрав все признаки, не удается отнести субъекта к тому или иному классу с данным уровнем надежности, то есть рассматриваемое отношение не выходит за пределы требуемых рубежей, то это означает, что имеющиеся результаты обследования не позволяют сделать прогноз с выбранным уровнем надежности. В этих случаях можно понизить этот уровень и таким образом сделать прогноз или обратиться за дополнительной информацией.
При отсутствии дополнительной информации для минимизации вероятности ошибки целесообразно построить два распределения отношения правдоподобия по всем признакам соответственно для групп «А» и «В» и на основе этих распределений выбрать один порог. Особенности распределения обычно таковы, что этим порогом редко бывает 1.
Как известно, в схемах последовательного статистического анализа [58] процедуры обосновываются для однородного случая, когда fA1(v1) = fA2(v2) =… = fAn(vn) и fB1(v1) = fB2(v2) =… = fBn(vn)
Однако нетрудно показать, что зависимость порогов от вероятности ошибок α и β переносится и на случай неодинаковых распределений, возникающих в диагностической задаче.
Практически удобно иметь дело не с отношениями вероятностей, а с логарифмом этого отношения. Тогда все вычисления сводятся к последовательному сложению.
Итак, определение принадлежности векторов v (v1, v2, …, vn) к множеству {vA} или {vB} осуществляется следующим образом. Последовательно вычисляются величины L1, L2, …, Lk, где
Каждое вычисленное Lk сравнивается с порогами
Если при некотором k < n
то вычисляется Lk+1. Если же
то v ⊂ {vB}; если же
то v ⊂ {vB}.
10.5.3. Градация признаков
При использовании любых количественных методов для отбора приходится прибегать к квантованию признака, так как часто не удается достаточно точно измерить то или другое свойство человека, определяющее его индивидуальные психологические особенности. В таких случаях количество градаций зависит от нашего умения дифференцировать данный признак. Если признак измеряется достаточно точно (например, время реакции), то число градаций можно объективизировать. В данном случае, когда необходимо строить одномерные распределения признаков, число градаций в первую очередь зависит от количества лиц в обучающих группах. Если число лиц достаточно велико, число градаций принимается равным 9–12.
Если же число лиц невелико (25–30 человек), то квантование признака на диапазоны обеспечивается, исходя из особенностей получающихся гистограмм. На основании опыта установлено, что в таких случаях достаточно 2, 3, 4 диапазона. В ряде случаев, когда распределения имеют сложную форму, диапазоны градаций будут неодинаковыми.
Общим правилом здесь может быть указание, предписывающее делать такие диапазоны, при которых расстояние (например, X2) между соответствующими распределениями fA(V) и fB(V) будет наибольшим.
10.5.4. Выбор порога
В последовательной статистической процедуре отношения вероятностей предусматриваются два порога:
где α, β – ошибки классификации, которые назначаются заранее. Простая зависимость порогов от вероятностей ошибок классификации позволяет выбирать нужный порог, основываясь на сложившейся конъюнктуре.
Необходимость выбора небольшого числа лиц из больших контингентов делает возможным определить a = b порядка 0,001 или даже 0,0001. С другой стороны, при ограниченном количестве лиц естественно выбрать α = β = 0,05 или даже 0,10.
Если окажется, что ошибка пропустить хорошего специалиста и, наоборот, ошибка приема малопригодного неравноценны, то имеется возможность учесть это, выбирая разные вероятности α и β.
Таким образом, выбор порогов является весьма гибким и учитывает реальную обстановку, а также цену возможных ошибок.
10.5.5. Пример
Проиллюстрируем на примере изложенный выше алгоритм определения профессиональной пригодности по психологическим показателям.
Разбиение на классы. В качестве исходного материала для составления дифференциально-диагностической таблицы были использованы результаты психологического обследования двух групп операторов, которых по объективным производственным показателям и характеристикам ведущих специалистов можно отнести к классу «хороших» («А») и «плохих» («В») специалистов.
Представители этих двух классов различались между собой по своей квалификации, а также, частично, по опыту работы.
Операторы, отнесенные к классу «А» (34 человека в возрасте 27–32 лет), прошли длительную подготовку по специальности и имели практический опыт работы в сложных системах управления. Все они характеризовались как специалисты высокой квалификации.
Лица, объединенные в класс «В» (33 человека в возрасте 23–29 лет), имели более низкий уровень подготовки и выполняли операторскую деятельность в менее сложных системах управления.
Психологические показатели. Для оценки состояния ряда психологических качеств и психофизиологических функций был использован комплекс табличных тестов и аппаратурных методик, выбор которых определен требованиями к состоянию ведущих систем организма у данных специалистов. Это:
1. Корректурная проба с кольцами: а) время выполнения задания в сек; б) относительная частота ошибок;
2. «Компасы»: коэффициент успешности;
3. «Отыскивание чисел с переключением»: а) время выполнения задания в сек.; б) производительность – время выполнения одной операции в сек.; в) количество ошибок;
4. «Сложение с переключением»: а) производительность – количество сложений за мин.; б) величина различия в темпе работы; в) относительная частота ошибок;
5. «Перепутанные линии»: а) производительность – количество просмотренных линий за 10 мин.; б) количество ошибок;
6. «Расстановка чисел»: а) производительность; б) относительная частота ошибок;
7. «Память на числа» – воспроизведение сразу после экспозиции: а) коэффициент успешности
где с – общее число зафиксированных чисел, m – число ошибочно воспроизведенных чисел, n – число невоспроизведенных чисел; б) количество правильно воспроизведенных чисел;
8. «Память на числа» – воспроизведение через 30 мин. после экспозиции: а) коэффициент успешности; б) количество правильно воспроизведенных чисел;
9. «Реакция на движущийся объект»: а) относительная частота точных ответов