Психология личности. Тема 6. Теория научения в психологии личности.

ТЕМА 6. ТЕОРИЯ НАУЧЕНИЯ В ПСИХОЛОГИИ ЛИЧНОСТИ

6.1. Теория оперантного обусловливания Б.Скиннера

Психологические понятия - научение, обучение, учение описывают широкий круг явлений, связанных с приобретением опыта, знаний, навыков, умений в процессе активного взаимоотношения субъекта с предметным и социальным миром - в поведении, деятельности, общении.

Обычно термины обучение и учение обозначают процесс приобретения индивидуального опыта, а термин "научение" описывает и сам процесс, и его результат.
          Итак, научение (обучение, учение) - процесс приобретения субъектом новых способов осуществления поведения и деятельности, их фиксации и/или модификации. Изменение психологических структур, которое происходит в результате этого процесса, обеспечивает возможность дальнейшего совершенствования деятельности.
          Известны классические концепции научения. Это, например, учение И.П. Павлова (1849-1936) об образовании условных рефлексов. В результате одного или нескольких предъявлений индифферентного разграничителя (условного стимула) и следующего за ним безусловного стимула (пищи), который вызывает безусловную, врожденную реакцию (слюноотделение), индифферентный раздражитель сам начинает вызывать реакцию. В процессе установления временной связи безусловный стимул выполняет функцию подкрепления, условный - сигнальное значение, а рефлекс способствует адаптации организма к меняющимся условиям среды.
          Впервые закономерности научения, установленные экспериментальными методами, были установлены в рамках бихевиоризма. Эти закономерности, или "законы обучения", сформулированы Э. Торндайком и дополнены, а также модифицированы К. Халлом, Э. Толменом и Э. Газри.

В теориях научения (И.П. Павлов) приспособление рассматривается как аналог развития человека. Оно может осуществляется разными путями, например посредством классического обусловливания по Павлову.

Типичный эксперимент заключался в том, что собаку закрепляли ремнями, ограничивая ее движение, затем включали свет. Через 30 секунд, после того как зажигался свет, в рот собаки клали немного пищи, что вызывало слюноотделение. Сочетание включения света и пищи повторяли несколько раз. Через какое-то время свет, изначально выступавший индифферентным раздражителем, сам по себе начинал вызывать реакцию слюноотделения.
          Аналогичным образом можно выработать условные оборонительные реакции на первоначально нейтральные стимулы. В первых исследованиях по оборонительному обусловливанию на собаку надевали специальную упряжь, чтобы удерживать ее в станке, а к лапе прикрепляли электроды. Подача электрического тока (безусловный раздражитель) на лапу вызывала отдергивание лапы (безусловный рефлекс), которое было рефлекторной реакцией животного. Если непосредственно перед ударом током несколько раз звонил звонок, то постепенно звук сам по себе был способен вызывать оборонительный рефлекс отдергивания лапы.
          По терминологии И.П. Павлова, пища (или удар током) были безусловными раздражителями, а свет (или звук) - условным. Слюноотделение (или отдергивание лапы) при появлении пищи (или ударе током) были названо безусловным рефлексом, а слюноотделение на включение света (или отдергивание лапы на звук) - условным. Реакции, которые изучал Павлов, стали называть ответными, или респондентными, поскольку они автоматически возникали вслед за известными стимулами (пищей, ударом тока). Ведущим в модели И.П. Павлова является стимул, манипуляция которым приводит к возникновению новых форм поведения.
          Итак, классическое обусловливание - это процесс, открытый И.П. Павловым, благодаря которому первоначально нейтральный стимул начинает вызывать реакцию из-за своей ассоциативной связи со стимулом, автоматически порождающим ту же самую или похожую реакцию.
          Теория, разработанная Б.Ф. Скиннером (1904-1990), носит название теории оперантного обусловливания. Он говорил, что ученый, как и всякий другой организм, является продуктом уникальной истории. Поприще, которое он выберет для себя в качестве предпочтительного, частично будет зависеть от его личной биографии.
          Интерес к формированию и модификации поведения возник у Скиннера после знакомства с работой И.П. Павлова "Условные рефлексы" и статьей (критической по своей направленности) Бертрана Рассела. Статьи последнего не только не оттолкнули от павловских идей, но, наоборот, усилили их влияние.
          Скиннер ставил перед собой цель объяснить механизмы научения у человека и животных (крыс и голубей) на основе ограниченного набора базовых принципов. Основная идея состояла в том, чтобы управлять средой, контролировать ее, получая при этом упорядоченные изменения. Он говорил: "Проконтролируйте условия (среду), и вам откроется порядок".


6.1.1. Определение оперантного обусловливания

Процедура обучения получила название - "оперантное обусловливание". Она заключалась в стремлении экспериментатора установить связь между стимулом (S) и реакцией (R) посредством подкрепления - поощрения или наказания. В схеме стимул-реакция (S-R) ключевой для Скиннера была именно реакция. Реакции рассматривались с точки зрения простоты-сложности. Простая - слюноотделение, отдергивание руки; сложная - решение математической задачи, агрессивное поведение (см. Хрестомат. 6.3).
          Оперантное обусловливание - это процесс, посредством которого характеристики реакции детерминируются последствиями этой реакции.
          Далее, Скиннер различал (1) реакции, которые вызываются определенными стимулами (отдергивание руки от горячего предмета) - в этом случае связь стимула и реакции безусловна; и (2) реакции, которые непосредственно не связаны со стимулом. Последние реакции продуцируются самим организмом и называются оперантами. Скиннер считал, что сами по себе стимулы не принуждают индивида реагировать на них. Исходная причина лежит в самом организме. В любом случае поведение происходит без воздействия какого-то специального побуждающего стимула. Осуществление оперантного поведения заложено в биологической природе организма. Научение рассматривалось Скиннером как процесс. Ни один (особенно сложный) оперант не возникает сразу. Процесс представляет собой поощрение оперантного поведения животного. Поощрение или наказание - это подкрепление, или стимул, который следует за реакцией и увеличивает вероятность ее появления. Когда голубь тычет клювом в диск (или крыса нажимает лапой на рычаг) - это оперантное поведение, при котором, если оно сопровождается подкреплением, увеличивается вероятность его повторения. "Оперантное обусловливание формирует поведение так же, как скульптор лепит фигуру из глины. Хотя в какой-то момент скульптор, казалось бы, создает совершенно новый объект, мы всегда можем вернуться назад, в начало процесса, к первоначальной недифференцированной болванке и выделить сколь угодно маленькие шаги, или последовательные этапы, следуя которым можно дойти до нужной кондиции. Ни в какой отдельно взятый момент не может появиться ничего такого, что очень сильно отличалось бы от того, что ему предшествовало… Оперант - это не то, что появляется в поведении уже полностью в готовом виде. Это результат непрерывного процесса формирования" (цит. по: Первин Л., Джон О. Психология личности. Теория и исследования. М., 2000. С.350).


6.1.2. Принципы оперантного обусловливания

Подкрепление является одним из принципов обусловливания. Уже с младенческого возраста, согласно Скиннеру, поведение людей можно регулировать с помощью подкрепляющих стимулов. Существуют два разных вида подкрепления. Некоторые, например еда или устранение боли, называются первичными подкреплениями, т.к. они обладают естественной подкрепляющей силой. Другие подкрепляющие стимулы (улыбка, внимание взрослого, одобрение, похвала) являются обусловленными подкреплениями. Они становятся таковыми в результате частого сочетания с первичными подкреплениями.
          Оперантное обусловливание опирается в основном на положительное подкрепление, т.е. на такие последствия реакций, которые их поддерживают или усиливают, например, пища, денежное вознаграждение, похвала. Тем не менее Скиннер подчеркивает важность негативного подкрепления, которое приводит к угасанию реакции. Такими подкрепляющими стимулами могут быть физическое наказание, моральное воздействие, психологическое давление. При наказании неприятный стимул следует за реакцией, уменьшая вероятность того, что реакция появится вновь. Скиннер с сожалением замечал, что наказание - "это самая распространенная техника контроля над поведением, применяемая в современном мире. Схема всем известна: если мужчина ведет себя не так, как вам нравится, ударьте его кулаком, если ребенок плохо себя ведет, отшлепайте его, если люди в другой стране плохо себя ведут, сбросьте на них бомбу" (цит. по: Крэйн У. Секреты формирования личности. СПб.: Прайм-Еврознак, 2002. С. 241).
          Кроме подкрепления, принципом обусловливания является его незамедлительность. Было обнаружено, что в начальной стадии эксперимента можно довести реакцию до наивысшего уровня только в том случае, если подкреплять ее немедленно. Иначе реакция, начавшая было формироваться, быстро угаснет.
          При оперантном, так же как и при респондентном, обусловливании наблюдается генерализация стимулов. Генерализация - это возникшая в процессе обусловливания ассоциативная связь реакции со стимулами, похожими на те, на которые первоначально был выработан условный рефлекс. Примерами генерализации являются - страх перед всеми собаками, который сформировался вследствие нападения какой-то одной собаки, положительная реакция ребенка (улыбка, произнесение слова "папа", движение на встречу и проч.) на всех мужчин, похожих на его отца.
          Формирование реакции представляет собой процесс. Реакция не возникает сразу и вдруг, она оформляется постепенно, по мере осуществления ряда подкреплений. Последовательное подкрепление - это выработка сложных действий с помощью подкрепления действий, которые постепенно все больше становятся похожими на ту окончательную форму поведения, которую предполагалось сформировать. Сплошное поведение формируется в процессе подкрепления отдельных элементов поведения, которые в совокупности складываются в сложные действия. Т.е. серия первоначально усвоенных действий в конечной форме воспринимается как целостное поведение.
          Сам процесс поддерживается так называемым режимом подкрепления. Режим подкрепления - процент и интервал подкрепления реакций. Для исследования режимов подкреплений Скиннер изобрел ящик Скиннера (Skinner box), благодаря которому он наблюдал за поведением животных. Схематически это выглядит так:
          S1 - R - S2,
          где S1 - рычаг;
          R - нажатие на рычаг;
          S2 - пища (подкрепление).
          Поведение контролируется при помощи изменения условий среды (или подкрепления). Их, например, можно давать (1) через определенный промежуток времени, независимо от числа реакций; (2) через определенное число реакций (нажатие на рычаг) и др.


6.1.3. Режимы подкрепления

Были выделены такие режимы подкрепления: непрерывное подкрепление - предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию; прерывистое, или частичное, подкрепление.
          Для более строгой классификации режимов подкрепления было выделено два параметра - временное подкрепление и пропорциональное подкрепление. В первом случае подкрепляют только тогда, когда истек срок, в течение которого необходимо было выполнить соответствующую деятельность, во втором подкрепляют за объем той работы (количество действий), которая должна была быть произведена.

Скиннер говорил об индивидуальности подкреплений, о вариативности развития того или иного навыка у разных людей, а также у разных животных. Более того, само подкрепление носит уникальный характер, т.к. уверенно нельзя сказать, что у данного человека или животного может выступать в качестве подкрепления.


6.1.4. Рост и развитие личности

По мере того, как ребенок развивается, его реакции усваиваются и остаются под контролем подкрепляющих воздействий со стороны окружающей среды. В виде подкрепляющих воздействий выступают - пища, похвала, эмоциональная поддержка и др. Эта же идея излагается Скиннером в книге "Вербальное поведение" (1957). Он считает, что овладение речью происходит по общим законам оперантного обусловливания. Ребенок получает подкрепление при произнесении определенных звуков. Подкреплением служит не пища или вода, а одобрение и поддержка взрослых.
          С критическими замечаниями в адрес концепции Скиннера выступил в 1959 г. известный американский лингвист Н. Хомский. Он отрицал особую роль подкрепления в ходе овладения речью и критиковал Скиннера за пренебрежение синтаксическими правилами, которые играют роль в осознании человеком языковых конструкций. Он считал, что обучение правилам не требует особого учебного процесса, а совершается благодаря врожденному, специфическому речевому механизму, который называется "механизмом овладения речью". Таким образом, овладение речью происходит не в результате научения, а посредством естественного развития.


6.1.5. Психопатология

С точки зрения психологии научения нет необходимости искать объяснение симптомов болезни в скрытых глубинных причинах. Патология, согласно бихевиоризму, не недуг, а либо (1) результат неусвоенной реакции, либо (2) усвоенная неадаптивная реакция.

Изменение поведения также построено на принципах оперантного обусловливания, на системе модификации поведения и сопряженных с ним подкреплений.
          А. Изменение поведения может происходить вследствие самоконтроля.

Б. Изменение поведения может происходить и вследствие осуществления поведенческого консультирования. Во многом этот тип консультирования базируется на принципах научения.
          Вольпе (Wolpe) определяет терапию поведения как терапию обусловливания, подразумевающую использование сформулированных в процессе экспериментирования принципов научения с целью изменения неадекватного поведения. Неадекватные привычки ослабляются и устраняются; адаптивные привычки, напротив, вводятся и усиливаются.

6.1.6. Достоинства и недостатки теорий научения

6.2. Социально-когнитивная теория А. Бандуры

6.2.1. Обучение через наблюдение

Основным тезисом теории Альберта Бандуры было утверждение, что обучение может быть организовано не только посредством осуществления каких-либо действий, как это полагал Скиннер, но и с помощью наблюдения за поведением других людей. По всей видимости, механизмами такого обучения являются не только внешнее отслеживание последовательности совершаемых действий, но и внутренние детерминанты - когнитивные переменные. "Современная социально-когнитивная теория придерживается взгляда на человека как активное существо, использующее когнитивные процессы, чтобы представлять события, предвосхищать будущее, выбирать направление действия и взаимодействовать с другими людьми" (Первин Л., Джон О., 2000. С.434). Поведение можно объяснить взаимодействием человека с его окружением. Такой подход к исследованию был назван А. Бандурой реципрокным детерминизмом.
          Объектом наблюдения является не только модель поведения, но и последствия, к которым она приводит. Этот процесс Бандура назвал опосредованным (косвенным) подкреплением, которое также имеет когнитивный компонент - ожидание последствий. Бандура подчеркивал ситуативную специфичность ожиданий и убеждений человека, связанную с умением человека тонко дифференцировать и группировать многообразные условия и обстоятельства жизни. Вместе с тем восприятие одной и той же ситуации индивидуально вариативно и зависит от уникальных личностных характеристик.


6.2.2. Самоэффективность

Убеждения в самоэффективности влияют на мотивацию и на успешность деятельности, а также на способность справляться с проблемами и трудностями. Исследования показывают, что чувство контроля над событиями помогает человеку преодолеть стрессовые жизненные обстоятельства (см. Хрестомат. 6.2).


6.2.3. Компоненты обучения через наблюдение

Все эти условия определяют эффективность обучения. Однако усвоение модели еще не означает ее реализацию в поведении. Связь усвоения и исполнения зависит от подкреплений - поощрений и наказаний. Эксперимент Бандуры, ставший классическим, подтверждает это положение. В исследовании три группы детей наблюдали за моделью, демонстрирующей агрессивное поведение по отношению к кукле Бобо. В первой группе за агрессивным поведением модели не следовало никаких санкций, во второй группе агрессивное поведение модели поощрялось, в третьей - наказывалось. Сразу после наблюдения за агрессивным поведением дети из этих трех групп оказывались в одной из двух экспериментальных ситуаций. В первой ситуации детей оставляли одних в комнате, где было много игрушек, в том числе и кукла Бобо. За ними наблюдали через одностороннее зеркало. В другой ситуации детей побуждали к воспроизведению поведения модели.
          Оказалось, что в ситуации с позитивным побуждением к действию дети демонстрируют намного больше исполнительных агрессивных действий, чем в ситуации, где их не побуждали к действию. Поощрения/наказания также повлияли на исполнительную часть действия. Дети, наблюдавшие за агрессивным поведением модели, которую потом наказывали, продуцировали меньше агрессивных действий, чем дети, в присутствии которых модель вознаграждали.
          Агрессивное поведение рассматривалось не только как пример влияния подкрепления на усвоение модели, но и как стиль поведения, сформированный в процессе социализации.
          Процесс социализации - это механизмы, посредством которых общество побуждает своих членов действовать в соответствии с общепринятыми нормами. В рамках проблемы социализации Бандура рассматривает формирование агрессивного, полоролевого, просоциального поведения и саморегуляции.
          Формирование агрессивного поведения происходит под влиянием поощрений детей взрослыми людьми проявлять агрессию в социально приемлемых формах (например, в играх, при отстаивании своего мнения, как инструментальную форму агрессивного поведения) и наказаний за социально неприемлемые формы агрессии (нанесение ущерба другому человеку, унижения). Известные эксперименты Бандуры, в которых одна группа детей смотрела по телевизору фильмы со сценами насилия, а другая была контрольной, показали, что научение по образцу происходит очень быстро, а медленно затухает (см. Хрестомат. 6.1).
          В процессе социализации дети обучаются навыкам поведения, соответствующим их половой принадлежности, мальчики - "мужским", а у девочки - "женским" чертам характера и поведенческим техникам. Сторонники теории социального обучения не отрицают влияния генотипа на полоспецифичное поведение, однако процессы социализации с их точки зрения занимают доминирующее положение в детерминации процесса усвоения половой роли. В процессе обучения полоролевому поведению различие между усвоением и исполнением приобретает особое значение. Дело в том, что дети наблюдают оба типа поведения - мужской и женский, а реализуют только то поведение, которое характерно для своего пола. Степень этой реализации зависит от меры подкрепления такого поведения.
          Отсутствие социального подкрепления, согласно Бандуре, ограничивает реализацию полоролевой модели в поведении, но не влияет на усвоение модели путем наблюдения.
          Просоциальное поведение связано с проявлением альтруистических и кооперативных стратегий. Оно формируется под влиянием поощрений взрослых и наблюдений ребенка за последствиями такого поведения. Многочисленные эксперименты показали, что поведение модели может влиять не только на способность детей делиться с другими, но и на оказание помощи попавшим в беду, на готовность к сотрудничеству и на проявление внимания к чувствам других людей.
          Саморегуляция связана с изменением локуса поощрений и наказаний. Если в начале процесса социализации ребенок зависим от внешних (экстринсивных) форм наказания и поощрения, то с опытом он переходит к внутренним формам подкрепления, т.е. становится способным к саморегуляции. Саморегуляция осуществляется на основе притязаний личности. Высокий уровень притязаний требует и высокого уровня достижений, он формируется под влиянием оценок родителей. Слишком трудные цели могут фрустрировать активность, вызывая депрессию и разочарования. Бандура считает, что такие люди могут справиться (совладать) с трудностями, если будут прорабатывать промежуточные цели. Эта стратегия не требует снижения уровня притязаний, сохраняя мотивацию достижения на должной для реализации целей высоте.
          Социально-когнитивная теория и теория личностных конструктов Дж. Келли имеют общие основания. Такими основаниями являются когнитивные структуры психики. Тем не менее по остальным позициям обе концепции не совпадают. Келли ориентирован на когнитивную психологию, на исследование, конструирование и прогнозирование реальности. Социально-когнитивная теория Бандуры ассоциируется не с когнитивной психологией, а с психологией научения (именно поэтому основные положения этой концепции мы излагаем в настоящей главе). Более того, "если сторонники теории личностных конструктов в какой-то степени интересуются тем, что человек думает, то сторонники социально-когнитивной теории интересуются тем, как связано то, что человек думает, с тем, что он чувствует и делает" (Первин Л., Джон О. Психология личности. Теория и исследования. М., 2000. С. 476).

Словарь терминов

  1. Научение
  2. Респондентное обусловливание
  3. Оперантное обусловливание
  4. Подкрепление
  5. Режимы подкрепления
  6. Наблюдение
  7. Косвенное подкрепление
  8. Самоэффективность


Вопросы для самопроверки

  1. Чем отличается оперантное обусловливание от респондентного?
  2. Что такое подкрепление? Каков смысл подкрепления в теории Скиннера?
  3. Какие режимы подкрепления являются наиболее эффективными?
  4. Что такое негативное подкрепление?
  5. Как происходит обучение с помощью наблюдения по А. Бандуре?
  6. В чем состоит самоэффективность? Каковы ее функции?
  7. Каковы причины агрессивного поведения по А. Бандуре?


Список литературы

  1. Баттерворт Дж., Харрис М. Принципы психологии развития. М.: Когито-Центр, 2000. 350 с.
  2. Бэрон Р., Ричардсон Д. Агрессия. СПб.: Питер, 1997. 336 с.
  3. Крэйн У. Секреты формирования личности. СПб.: Прайм-Еврознак, 2002. 512 с.
  4. Нельсон-Джоунс Р. Теория и практика консультирования. СПб.: Питер, 2000. 464 с.
  5. Первин Л., Джон О. Психология личности. Теория и исследования. М., 2000. 607.
  6. Скиннер Б. Оперантное поведение // История зарубежной психологии: Тексты. М., 1986. С. 60-82.
  7. Соколова Е.Е. Тринадцать диалогов о психологии. М.: Смысл, 1995. С. 653.
  8. Хьелл Л., Зиглер Д. Теории личности. СПб., Питер, 1997. 608 с.
  9. Первин Л., Джон О. Психология личности. Теория и исследования. М., 2000. С. 350.


Темы курсовых работ и рефератов

  1. Агрессия как социальное научение
  2. Самоэффективность и ее динамика
  3. Подражание и идентификация в теории А. Бандуры
  4. Проблема ожидания в социально-когнитивной теории
  5. Проблема социализации и ее решение в теориях научения