«У тренированных в разной степени животных форма вызванных потенциалов, возникающих под каждым электродом в ответ на два различных стимула, отчетливо различается. Эти различия в вызванных ответах наблюдались при регистрации реагирующих ансамблей клеток в пределах ограниченных областей мозга. Таким образом, клеточные ансамбли, сообщающие о наличии дифференцируемых сигналов, широко распространены по обширным областям мозга и постоянно обнаруживают два типа ответов на два различных стимула. Анализ показывает, что информация, содержащаяся в усредненных ответах каждого из этих двух локальных клеточных ансамблей, достаточна для различения двух периферических сигналов. Ансамбль из многочисленных реагирующих клеток обнаруживает поразительную стабильность в ответах, говорящую о существовании неизменного типа разрядов в ответ на каждый отдельный стимул. Напротив, активность одиночной клетки в высшей степени вариативна, проявляясь в виде разнообразных типов ответов при действии тех же самых стимулов. Эти факты говорят о том, что наборы разрядов обширных нейронных ансамблей служат гораздо более надежным источником информации, чем наборы разрядов одиночных клеток.
V обученных животных наблюдалось поразительное сходство в форме волн электрических ответов, регистрируемых в различных мозговых структурах. Анализ степени наклона кривых выявил, что эти сходные ответы широко распространены в головном мозгу, исключая проводящие пути. Динамическая природа этого феномена была проиллюстрирована фактами нарушения сходства при ошибочных ответах или при предъявлении новых стимулов. Эти факты свидетельствуют о том, что сходств» электрической активности в различных областях мозга отражает протекание некоторого эндогенного процесса, происходящего при научении, а не пассивно проявляющегося при действии физического стимула, как такового» (John and Morgades, 1969, p. 205-206).
Такое понимание процесса подкрепления начинают признавать даже бихевиористы. Так, в недавнем обзоре (Perkins, 1968) утверждается, что концепция «привлекательности» объединяет целый ряд ранее разрозненных фактов. Согласно этой теории, «все классические условные рефлексы могут быть описаны как подготовительные ответы, которые повышают характерную привлекательность комплекса стимулов, совпадающих с предъявлением безусловных стимулов». Другие авторы употребляют термин «желательность», «побудительная ценность» или «побуждение»; я пользуюсь в этой книге термином «интерес» как субъективным эквивалентом «привлекательности». Однако общий смысл: этих терминов сводится к тому, что назначением процесса подкрепления является обращение к некоторым предшествующим состояниям, к некой компетентности организма, что в свою очередь приводит к изменению этих состояний.
КОМПЕТЕНТНЫЙ МОЗГ
Что же тогда представляют собою эти состояния компетентности, которые регулируют поведение? Это иерархически организованные механизмы (логические модули), включающие серво-процессы, программы или планы, направленные на достижение внешнего эффекта, действия. В гл. XII и XIII была подробно описана нейронная организация механизма компетентности, участвующего в таких действиях, как, например, забивание гвоздя; анатомические структуры с однозначным соответствием между мышцами и корой мозга организуются в образ, который контролирует любые движения, диктуемые внешним или «силовым нолем» для достижения результата. Этот результат кодируется в образе, в состоянии, в микроструктуре медленных потенциалов соединений; все это происходит посредством оценки мгновенных экстраполяции тех изменений в текущем процессе регулирования, которые появляются при сопоставлении соответствующих силовых полей с достигнутым результатом.
Несколько более простой, но аналогичный механизм может быть описан по отношению к другим, более «внутренним» состояниям компетентности. Если у животных структуры ствола мозга (например, гипоталамус) стимулируются дискретными импульсами, возникают отдельные движения, имеющие отношение к еде, питью и т. д. Участки, ответственные за подобные отдельные движения, по-видимому, распределены в случайном порядке по довольно широкой области мозга. Так, например, движение облизывания губ может быть вызвано раздражением участка, расположенного вблизи зоны, ответственной за движение выгибания спины (Robinson, 1964). Широко рассеянными оказываются, по-видимому, даже участки мозга, являющиеся субстратом генетической памяти, связанной с инстинктами. Однако при более сильной стимуляции или раздражении более широких зон эти отдельные движения интегрируются в структуры поведения, которые связаны с той или другой инстинктивной потребностью или аффектом. Таким образом, движения захватывания чего-нибудь ртом, жевание и заглатывание образуют комплекс движений при «де; пригибание и отворачивание в сторону указывает на начало полета; выпускание когтей и оскаливание зубов, выгибание спины, расширение зрачков означает агрессию. Можно предположить, что сильная электрическая стимуляция выявляет те движения, которые в обычных условиях возникают при активации тех же самых структур во время аффективных состояний и влечений.
Рис. XIV-8. А – подкрепление моторных структур. Схема взаимосвязей между «подкрепляющей системой мозга» и системой ответов, основанная, на результатах экспериментов; В – роль сенсорного входа. Схема иллюстрирует взаимоотношение между специфическими потребностями и «непосредственным подкреплением», получаемым через сенсорный вход (Valenstein, 1970).
Это предположение родилось в результате серии изобретательных экспериментов, выполненных Э. Валенстайном, которые, однако, в свою очередь поставили ряд новых вопросов. В этих экспериментах электроды вживлялись в ту область гипоталамуса крыс, электрическое раздражение которой вызывает движения еды, питья и попыток грызть кусок дерева. Когда один из таких поведенческих актов наблюдался особенно явно и стабильно, внешние условия эксперимента менялись таким образом, что первоначальный результат нельзя было получить. Так, в опыте создавались такие условия, когда в течение целой ночи животное через нерегулярные интервалы подвергалось стимуляции. На следующее утро та же стимуляция ранее раздражаемого участка вызывала либо первоначальное, либо измененное поведение, что зависело от внешних условий, и, когда были испробованы все возможные варианты, обнаружилось, что часто доминировали новые выработанные движения. Валенстайн пишет:
«В стандартных тестах на выявление обусловленного стимулами поведения удалялся объект (цель, к которой стремилась крыса), и животное-переводилось на ночной режим, когда ему предъявлялись два других целевых объекта. Если, например, крыса во время стимуляции в первой серии опытов пила, то в ночное время сосуд с водой удалялся и в клетке сохранялись только кусочки пищи и дерева. Параметры стимула не менялись. Если животное не проявляло нового поведения, оно переводилось во второй, третий и т. д. раз на ночной режим. Однако в большинстве случаев-одного перевода на ночные условия было достаточно, чтобы возникало новое поведение. После появления нового поведения животным предъявлялись два стандартных теста, в которых начальный целевой объект отсутствовал, и третий стандартный тест (контрольный) со всеми тремя целевыми объектами. В тех случаях, когда животное не подвергалось стимуляции, всегда имелись все три целевых объекта, и, следовательно, животные могли насытиться пищей, напиться воды и удовлетворить свою потребность в том, чтобы грызть кусок дерева, еще до начала опыта. Одиннадцать животных прошли полностью через это испытание, что и составило первый эксперимент…
Вторая серия опытов была проведена после применения различного числа тренировочных стимуляций в условиях отсутствия целевого объекта, к которому прежде стремилось животное… в большинстве случаев вторично сгимулированное поведение появлялось так же закономерно, как и прежнее. Во время предъявления контрольного теста, когда одновременно присутствовали все три целевых объекта, в большинстве случаев с равной? вероятностью наблюдались два типа поведения. Как правило, один тип поведения возникал при действии первых трех-четырех серий стимулов, а затем возникало другое поведение в приблизительно одинаковых по длительности сериях опытов. При предъявлении контрольных тестов животные обнаруживали несколько видов поведения за время предъявления некоторых из 20 стимулов.
Мы хотели выяснить, станет ли доминирующим первый тип поведения, если мы дадим серию контрольных тестов. Хотя в этих опытах наблюдались разнообразные виды поведения, мы пришли к заключению, что как только закреплялся второй вид обусловленного стимулами поведения, печальное поведение, вызванное стимуляцией, переставало быть доминирующим. И, действительно, у ряда животных обнаружилось явное преобладание второго вида поведения во время предъявления контрольных тестов (Valenstein, Cox and Kakolewski, 1969, p. 247-249).