Некоторые условия, при которых происходит перестановка в системе «средства – цели», уже известны. Д. Примак (1959) провел эксперименты с выработкой оперантных условных рефлексов. Он измерял частоту ответов в значимой для организма ситуации (например, частоту актов еды), затем сравнивал эту величину с другой независимой величиной (например, частотой нажатия на рычаг). Полученные им результаты говорят о том, что подкрепление возникает всякий раз, когда ответы с низкой независимой частотой (нажатия на рычаг) совпадают – в определенных границах – со стимулами, которые управляли осуществлением ответов с высокой независимой частотой (еда).
Остроумная постановка эксперимента подтвердила эту точку зрения; один из этих опытов особенно показателен.
«Были созданы такие условия для крыс, которые вызывали в одном случае большую вероятность питья, чем бега, а в другом – большую вероятность бега, чем питья. У тех же самых животных бег служил подкреплением для питья, а питье – подкреплением для бега. Такие отношения означали, что «вознаграждался» попросту любой ответ, который сам по себе более вероятным, чем другой» (Premack, 1962, р 255; рис. XVI-2).
Отключение наказания
Рис. XVI-2. Опыты с оперантными условными рефлексами (крысы). Рисунок показывает, что число лизаний, необходимых для поворота колеса, зависит от 1) среднего числа нажатий на рычаг в серии; 2) средней продолжительности лизания; 3) средней продолжительности побе-жек. Треугольник в левой части верхнего рисунка означает исходную продолжительность лизания (Premack, 1965).
Очень интересен эксперимент, посвященный изучению активности животного в приспособлении с колесом, которое было снабжено тормозом и механизмом, прекращающим поступление жидкости.
«Преобладание питья над бегом обеспечивалось путем отключения этого механизма, освобождением колеса и предоставлением возможности чаще пить, чем бегать. Обратное достигалось остановкой колеса включением механизма, прекращающего поступление жидкости, и предоставлением возможноеги крутить колесо, то есть бегать чаще, чем пить» (Premack, 1962, р 255)
К сожалению, Примак рассматривает только связь между ответами. Ему не удалось полностью выявить те непосредственные операции, которые определяют ответ. Ответ в ситуации оперантных условных реакций указывает на то, что организм действует в зависимости от данной ситуации. Действие (как об этом говорилось в гл. XIII) подготавливается ие набором мышечных сокращений (движений) организма, а совокупностью внешних условий, вызывающих это движение. В действительности оперантный «ответ» как показатель действия является одним из компонентов этой совокупности. Следовательно, «частота ответа» – объект изучения Примака – имеет отношение не столько к быстроте движений, сколько к той скорости, с которой некоторые действительно наблюдаемые последствия этих движений могут быть зарегистрированы организмом. Например, в одних экспериментах наблюдалась обезьяна Цебус. Эта обезьяна прекрасно умела чмокать губами, кружиться в клетке и кувыркаться; все это были иррелевантпые движения, которые не должны были регистрироваться в данной ситуации как ответы, поскольку объектом изучения были манипуляции с рычагом, дверью и корзиной. Даже частные движения, включенные в эти действия, были совершенно несущественны в этих экспериментах – обезьяна могла пользоваться для выполнения действия правой или левой рукой, ногами или даже головой.
Короче говоря, оперантные условные ответы фактически представляют собой звенья какой-то последовательности, часть целого действия. Следовательно, вклад Примака в теорию научения состоит в том, что он установил, что частота осуществления последовательных действий определяет отношение «средства – цели». Таким образом, степень разнообразия действия может определяться количеством связанных с ситуацией последствий поведения, согласующихся с намерением, хотя, вероятно, частота ответа является не единственной переменной, определяющей это разнообразие. В данный момент мы можем установить по крайней мере, что при прочих равных условиях организм стремится управлять своими действиями, не просто уменьшая несоответствие между намерением и результатом поведения, а активно создавая такое соответствие. Достижение этого соответствия является не случайным: поведение строится таким образом, что последовательность звеньев действия организуется по законам иерархии – более близкие цели формируются в системе более отдаленных. По существу, эта иерархическая организация действия создает план или программу. Важность планов для организации поведения уже подробно обсуждалась в работе Миллера, Галантера и Прибрама (1965). Здесь я рассмотрю лишь один аспект этой проблемы, а именно значение планов для решения проблемы «средства – цели» и теории выполнения действия в целом.
ЗАЧЕНИЕ СТИМУЛА И ФОРМИРОВАНИЕ ПЛАНОВ
В книге «Планы и структура поведения» (Миллер, Галантер, Прибрам, 1965) обсуждались два аспекта проблемы мотивации: планы и значимость поведения. Планы строго направляют поведение, то есть выбор программ выполнения этих планов. Значимость играет несколько иную, менее специализированную роль в запуске планов, их выполнении и завершении. Если рассматривать значимость как фактор, определяющий выполнение и завершение действия, то понятие значимости поведения становится более ясным. Таким образом, эффект действия, подкрепляющий его результаты, обнаруживает две особенности: он может обеспечивать информацию, то есть сокращать количество неопределенности в ситуации или направлять поведение организма, определяя его значимость (рис. XVI-1). Рассмотрим две эти особенности подкрепляющего эффекта действия более подробно.
Во второй части книги мы показали, что сенсорные возбуждения вызывают длительные изменения в работе центральной нервной системы. Возникшие констелляции нервных процессов могут быть описаны как процессы, происходящие в сенсорном, «входе». Если эти сенсорные потоки адресуются к одной из «компетентных» систем, они превращаются в воспринимаемую информацию. Таким образом, количество воспринимаемой информации может быть определено как величина совпадения между входом информации и компетентностью систем. Это определение следует из теории информации, согласно которой количество воспринимаемой информации соответствует количеству информации, передаваемой по каналам, пропускная способность которых соответствует нервной компетентности.
В гл. XIV, однако, было отмечено, что мобилизация компетентности организма зависит от гибкого, способного к модификациям механизма, который описан в гл. XV как процесс подкрепления, ведущий к завершению поведенческого акта. Необходимость в завершении действия возникает потому, что нервный субстрат поведения (по крайней мере у млекопитающих) не содержит локальных механизмов, работа которых автоматически ведет к выполнению акта. Вместо этого существуют механизмы, запускающие частные виды активности, связанные с различными отделами нервной системы; для выполнения акта необходима интеграция, организация этих частных видов активности. Такое распределение частных функций, очевидно, свойственно всей нервной системе, и в главах VI, VII и VIII мы рассматривали влияние этого неврологического факта на процесс переработки сенсорной информации (и необходимость таких явлений, как топографическая трансформация и т. д.). Теперь я хочу добавить к этому следующий важный вывод: переработка сенсорной информации, поскольку она является подкреплением, формирует вначение стимула. Как известно, раньше все проблемы психологии сводились к двум вопросам: какова природа сходства стимулов и какова природа подкрепления. В действительности же это вовсе не две проблемы: сходство и подкрепление представляют любой одно и то же явление, хотя в одном случае оно описывается преимущественно на языке стимулов (сходство), а в другом- главным образом на языке ответов (подкрепление). Подкрепление последовательно увеличивает способность к различению стимулов и уменьшает их генерализацию; процесс различения стимулов, то есть приобретения ими определенного значения, и есть подкрепление.
Нервные процессы, участвующие, согласно этой точке зрения, в механизме научения, будут коротко описаны ниже.
«Возможно, что эта модель является прекрасным описанием того, что представляет собой подкрепление для организма. Этот нервный механизм в силу иерархической природы его избирательного контроля над его же собственными модификациями допускает изменение Образа результата в ходе последовательных актов поведения. Всякий раз, когда поступающая информация такова, что не происходит полного совпадения этой информации с Образом результата, последний модифицируется для того, чтобы включить эту информацию, и поведение продолжается. Таким образом, организм может в относительно неизменных или мало изменяющихся внешних условиях осуществлять поиск во внешней среде той дополнительной информации, которая ему необходима для уменьшения неопределенности. Эта нервная модель могла бы быть ответственной за процесс поиска информации организмом, нуждающимся в такой информации, до тех пор, пока корригирующие изменения в Образе результата ие прекратятся, то есть до тех пор, пока не будет достигнута стабильность» (Pribram, 19606, р. 8).