Мы не можем обойти эти проблемы, выбрав реакцию, которая более строго определяется свойствами среды, например открытие двери. Определенный механический индикатор поведения, разумеется, предпочтительнее, поскольку, например, он позволяет организовать постоянное представление подкрепления. Можно регистрировать высоту поднятия голубем головы с помощью фотоэлемента, но легче выбрать такую реакцию, которая производит изменение в среде и которую легче регистрировать. Если птица научается нажимать на небольшой рычаг, находящийся на стене экспериментального ящика, можно сконструировать рычаг таким образом, чтобы он замыкал электрическую цепь, что позволит предъявлять поднос с пищей и регистрировать реакции. Думается, что такая реакция отличается от реакции поднятия головы тем, что она имеет характеристику «все или ничего». Но ниже будет видно, что «реакция», которая не так произвольна, как реакция поднятия головы, не определяется механическими свойствами движения «нажатия на рычаг».
Нет необходимости иметь совершенное экспериментальное устройство для того, чтобы получить важные количественные данные об оперантном обусловливании. Мы уже можем оценивать много факторов. Важность обратной связи ясна. Организм можно стимулировать последствием его поведения, если имеет место обусловливание. Например, при обучении шевелить ушами необходимо знать, когда уши двигаются, если мы хотим подкреплять двигательные реакции. При переучивании больного пользоваться частично парализованной конечностью можно с помощью специальных приспособлений или другого человека усиливать обратную связь при слабых движениях. Глухонемой научается говорить, только если он получает обратную связь о. своем поведении, что можно сравнить со стимуляцией, которую он получает от других говорящих людей. Одной из функций педагога является обеспечение произвольных (иногда ложных) последствий с целью получения обратной связи. Обусловливание также зависит от вида, количества и момента предъявления подкрепления, а также от многих других факторов.
Отдельное подкрепление может иметь значительный эффект.
При благоприятных условиях один какой-нибудь резкий шаг может привести к увеличению частоты появления реакции в дальнейшем. В обычных случаях такое значительное увеличение наблюдается уже после одного подкрепления, и дальнейший дополнительный прирост величины продолжается по мере предъявления последующих подкреплений. Это наблюдение ни в коей мере нельзя объяснить мгновенным изменением в сторону максимальной вероятности, поскольку не выделен оперант в чистом виде. Увеличение частоты можно интерпретировать с точки зрения других поведенческих характеристик ситуации. Тот факт, что обусловливание организма может быть быстрым у животных такого «низкого уровня развития», как крысы и голуби, приводит к интересным выводам. Различия в том, что обычно называют интеллектом, до некоторой степени объясняются различиями в скорости научения. Но не может существовать более быстрого научения, чем мгновенное увеличение вероятности реакции. Следовательно, специфичность человеческого поведения определяется какими-то другими факторами.
УПРАВЛЕНИЕ (CONTROL) ОПЕРАНТНЫМ ПОВЕДЕНИЕМ
Экспериментальная процедура оперантного обусловливания не сложна. Создается контингент подкрепления и предъявляется организму в течение определенного периода времени. Затем на основе этого объясняется частота возникновения реакции. Что было сделано в на-: правлении предсказания и управления поведением в будущем? Какие переменные заставляют нас предсказывать, будет или не будет реагировать организм? Какими переменными нужно управлять, чтобы заставить организм реагировать? Мы экспериментируем с голодным голубем. Это означает, что голубь лишался пищи в течение определенного периода времени или до тех пор, пока он немного не терял в весе. В противоположность тому, что можно было бы ожидать, экспериментальные исследования показали, что сила эффекта пищевого под- крепления может не зависеть от количества пищи. Но наблюдается, что частота реакций, которая является результатом подкрепления, зависит от степени депривации. Даже если мы научили голубя вытягивать шею, он не будет этого делать, если он не голоден. Таким образом, имеется еще один способ контроля за его поведением: для того чтобы заставить голубя вытягивать шею, необходимо лишить его пищи. Выбранный оперант прибавляется ко всему тому, что будет делать голодный голубь. Контроль за реакцией объединился с контролем за лишением животного пищи. Оперант " может также контролироваться с помощью внешнего стимула, являющегося еще одной переменной величиной, которую можно использовать для предсказания поведения и контроля за ним. Тем не менее следует отметить, что обе эти переменные можно вывести из самого оперантного подкрепления.
Когда подкрепление больше не поступает, реакция становится все менее и менее частой; этот процесс получил название «оперантного угашения». Если задержать подачу пищи, голубь перестанет поднимать голову. В общем, когда мы выполняем поведение, которое больше «не приносит нам никакой выгоды», мы утрачиваем тенденцию повторять его. Если мы потеряли авторучку, мы все реже и реже направляем руку в карман, в котором она хранилась. Если нам не отвечают на телефонные звонки, то в конце концов мы перестаем звонить. Если пианино расстраивается, то мы все реже и реже на нем играем. Если звук нашего радиоприемника стал слишком громким или передачи стали хуже, мы перестаем его слушать.
Поскольку оперантное угашение протекает гораздо медленнее, чем оперантное обусловливание, постольку наблюдать за ним гораздо проще. При благоприятных условиях получаются плавные кривые, показывающие, что скорость реакций медленно уменьшается, возможно, в течение нескольких часов. Кривые раскрывают свойства, которые нельзя получить из наблюдения. У нас «может сложиться впечатление», что организм реагирует реже и реже, но за характером изменения можно проследить только при регистрации поведения. Кривые показывают, что угашение есть довольно однородный процесс, который определяет силу поведения.
При определенных условиях на кривую оказывают влияние эмоциональные реакции. Отсутствие подкрепления приводит не только к угашению операнта. Оно вызывает также реакцию фрустрации, или ярости. Голубь, который не получил подкрепления, отворачивается от рычага, воркует, хлопает крыльями и демонстрирует другие виды эмоционального поведения. Человек также демонстрирует подобные реакции. Ребенок, у которого велосипед не двигается с места, когда он нажимает на педали, перестает их крутить. Взрослый, который находит ящик письменного стола запертым, скоро перестает дергать ручку, но он может колотить по столу и браниться или может проявлять другие признаки гнева. Точно так же как ребенок вновь вернется к велосипеду, а взрослый — к ящику стола, птица вновь повернется к рычагу, когда эмоциональная реакция угаснет. Могут наблюдаться и другие явления эмоционального характера. В таких условиях кривая угашения характеризуется циклическими колебаниями, поскольку эмоциональные реакции появляются, исчезают и вновь появляются. Если каким-либо способом удается устранить эмоцию, кривая принимает более простую форму.
Поведение, которое наблюдается во время угашения, является результатом обусловливания, которое ему предшествовало, и в свете этого кривая угашения дает еще одну меру эффекта подкрепления. Если было подкреплено всего лишь несколько реакций, угашение происходит быстро. Большое количество подкреплений приводит к длительному сохранению реакции. Силу сопротивления угашению нельзя предсказать по вероятности реакции, наблюдаемой в каждый отдельный момент. Необходимо знать историю подкрепления. Например, если мы получили подкрепление в виде великолеп-, но приготовленной пищи в новом ресторане, невкусно приготовленная пища может «свести на нет» хорошее впечатление от этого ресторана; но если мы питались в ресторане качественной пищей в течение многих лет, то тогда, при прочих равных условиях, нам надо будет несколько раз принять невкусную пищу, прежде чем мы утратим склонность постоянно питаться в нем.
Между количеством подкрепленных реакций и количеством реакций, возникающих при угашении, нет простых связей. Сила сопротивления угашению в режиме прерывистого подкрепления может быть гораздо больше силы сопротивления угашению в случае, когда то же количество подкреплений дается за каждую реакцию. Таким образом, если мы только один раз случайно подкрепим ребенка за хорошее поведение, то оно при отсутствии подкрепления будет сохраняться дольше, чем в том случае, когда мы подкрепляем каждое правильное выполнение.