Без кейворда

К концу этого раздела вы сможете: Определить оперантное обусловливаниеОбъясните разницу между подкреплением и наказаниемРазличать графики армированияПредыдущий раздел этой главы был посвящен типу ассоциативного обучения, известному как классическая обусловленность.

К концу этого раздела вы сможете:

  • Определить оперантное обусловливание
  • Объясните разницу между подкреплением и наказанием
  • Различать графики армирования

Предыдущий раздел этой главы был посвящен типу ассоциативного обучения, известному как классическая обусловленность. Помните, что при классическом кондиционировании что-то в окружающей среде автоматически запускает рефлекс, и исследователи учат организм реагировать на другой стимул. Теперь обратимся ко второму типу ассоциативного обучения - оперантному условию. При оперантном обусловливании организмы учатся связывать поведение и его последствия. Приятное последствие повышает вероятность повторения такого поведения в будущем. Например, дельфин Спирит из Национального аквариума в Балтиморе делает сальто в воздухе, когда ее дрессировщик дает свисток. Следствием этого является то, что она получает рыбу.

Сравнение классического и оперантного кондиционирования Классическое кондиционирование Оперантного кондиционирования
Кондиционирующий подход Безусловный стимул (например, еда) сочетается с нейтральным стимулом (например, звонком). Нейтральный раздражитель со временем становится условным раздражителем, вызывающим условную реакцию (слюноотделение). За целевым поведением следует подкрепление или наказание, чтобы усилить или ослабить его, чтобы учащийся с большей вероятностью проявил желаемое поведение в будущем.
Время стимула Стимул возникает непосредственно перед ответом. Стимул (либо поощрение, либо наказание) возникает вскоре после реакции.

Психолог Б.Ф. Скиннер заметил, что классическая обусловленность ограничивается существующим поведением, которое вызывается рефлексивно, и не учитывает новое поведение, такое как езда на велосипеде. Он предложил теорию о том, как возникает такое поведение. Скиннер считал, что поведение мотивируется последствиями, которые мы получаем от поведения: подкреплениями и наказаниями. Его идея о том, что обучение является результатом последствий, основана на законе эффекта, который впервые был предложен психологом Эдвардом Торндайком. Согласно закону эффекта, поведение, за которым следуют удовлетворяющие организм последствия, с большей вероятностью будет повторяться, а поведение, сопровождающееся неприятными последствиями, с меньшей вероятностью будет повторяться (Thorndike, 1911). По сути, если организм делает что-то, что приводит к желаемому результату,организм с большей вероятностью сделает это снова. Если организм делает что-то, что не приводит к желаемому результату, у него меньше шансов сделать это снова. Пример закона действия - занятость. Одна из причин (а часто и основная причина) того, что мы приходим на работу, заключается в том, что нам за это платят. Если нам перестанут платить, мы, скорее всего, перестанем появляться, даже если мы любим свою работу.

Основываясь на законе эффекта Торндайка, Скиннер начал проводить научные эксперименты на животных (в основном на крысах и голубях), чтобы определить, как организмы учатся через оперантную обусловленность (Скиннер, 1938). Он поместил этих животных в оперантную камеру кондиционирования, известную как «ящик Скиннера». Коробка Скиннера содержит рычаг (для крыс) или диск (для голубей), на который животное может нажимать или клевать в награду за еду через дозатор. Динамики и свет могут быть связаны с определенным поведением. Регистратор подсчитывает количество ответов животного.

(а) Б.Ф. Скиннер разработал оперантную обусловленность для систематического изучения того, как поведение усиливается или ослабляется в зависимости от его последствий. (b) В ящике Скиннера крыса нажимает на рычаг в действующей камере кондиционирования, чтобы получить пищевое вознаграждение. (кредит а: модификация работы «Глупого кролика» / Wikimedia Commons)

Ссылка на обучение

Посмотрите этот краткий видеоклип, чтобы узнать больше об оперантной обусловленности: интервьюируется Скиннером, и демонстрируется оперантная обусловленность голубей.

Обсуждая оперантное обусловливание, мы используем несколько повседневных слов - положительный, отрицательный, подкрепление и наказание - в специальной манере. В оперантной обусловленности положительное и отрицательное не означают хорошее и плохое. Вместо этого положительное означает, что вы что-то добавляете, а отрицательное - что-то убираете. Подкрепление означает, что вы усиливаете поведение, а наказание означает, что вы уменьшаете поведение. Подкрепление может быть положительным или отрицательным, а наказание также может быть положительным или отрицательным. Все подкрепления (положительные или отрицательные) увеличивают вероятность поведенческой реакции. Все каратели (положительные или отрицательные) уменьшаютсявероятность поведенческой реакции. Теперь давайте объединим эти четыре термина: положительное подкрепление, отрицательное подкрепление, положительное наказание и отрицательное наказание.

Положительное и отрицательное подкрепление и наказание Армирование Наказание
Положительный Что-то добавлено для увеличения вероятности поведения. Что-то добавлено для уменьшения вероятности поведения.
Отрицательный Что-то удаляется, чтобы повысить вероятность поведения. Что-то удаляется, чтобы снизить вероятность поведения.

УСИЛЕНИЕ

Самый эффективный способ научить человека или животное новому поведению - это положительное подкрепление. При положительном подкреплении добавляется желаемый стимул для улучшения поведения.

Например, вы говорите своему пятилетнему сыну Джерому, что если он уберет свою комнату, он получит игрушку. Джером быстро убирает свою комнату, потому что ему нужен новый набор произведений искусства. Сделаем паузу на мгновение. Некоторые люди могут спросить: «Почему я должен вознаграждать своего ребенка за то, что он делает то, что от него ожидается?» Но на самом деле в нашей жизни мы постоянно и постоянно получаем вознаграждение. Наши зарплаты - это награды, так же как и высокие оценки и прием в нашу любимую школу. Похвала за хорошую работу и прохождение водительского экзамена также является наградой. Положительное подкрепление как инструмент обучения чрезвычайно эффективно. Было обнаружено, что одним из наиболее эффективных способов повышения успеваемости в школьных округах с оценками чтения ниже среднего была оплата детям за чтение. Конкретно,Второклассникам в Далласе платили по 2 доллара каждый раз, когда они читали книгу и проходили короткую викторину по книге. Результатом стало значительное улучшение понимания прочитанного (Фрайер, 2010). Что вы думаете об этой программе? Если бы Скиннер был жив сегодня, он, вероятно, подумал бы, что это отличная идея. Он был ярым сторонником использования принципов оперантного обусловливания для влияния на поведение учеников в школе. Фактически, помимо ящика Скиннера, он также изобрел то, что он назвал обучающей машиной, которая была разработана, чтобы вознаграждать небольшие шаги в обучении (Скиннер, 1961) - один из первых предшественников компьютерного обучения. Его обучающая машина проверяла знания учеников, когда они работали над различными школьными предметами. Если ученики правильно ответили на вопросы, они сразу же получали положительное подкрепление и могли продолжить обучение. если они ответили неправильно,они не получили подкрепления. Идея заключалась в том, что студенты будут тратить дополнительное время на изучение материала, чтобы повысить свои шансы получить подкрепление в следующий раз (Скиннер, 1961).

При отрицательном подкреплении нежелательный стимул удаляется, чтобы усилить поведение. Например, производители автомобилей используют принципы отрицательного усиления в своих системах ремней безопасности, которые издают «гудок, гудок, гудок», пока вы не пристегнете ремень безопасности. Раздражающий звук прекращается, когда вы демонстрируете желаемое поведение, увеличивая вероятность того, что вы пристегнетесь в будущем. Отрицательное подкрепление также часто используется в тренировках лошадей. Всадники оказывают давление - натягивая поводья или сжимая ноги, - а затем снимают давление, когда лошадь выполняет желаемое поведение, такое как поворот или ускорение. Давление - это негативный стимул, который лошадь хочет устранить.

НАКАЗАНИЕ

Многие люди путают отрицательное подкрепление с наказанием в качестве оперантного обусловливания, но это два совершенно разных механизма. Помните, что подкрепление, даже если оно отрицательное, всегда увеличивает поведение. Напротив, наказание всегда снижает поведение. В положительном наказании вы добавляете нежелательный стимул к снижению поведения. Пример положительного наказания - отругать ученика, чтобы он перестал писать текстовые сообщения в классе. В этом случае добавляется стимул (выговор), чтобы уменьшить поведение (текстовые сообщения в классе). При отрицательном наказании вы удаляете приятный стимул к снижению поведения. Например, водитель может включить гудок, когда загорится зеленый свет, и продолжать гудеть до тех пор, пока впереди идущий автомобиль не двинется с места.

Наказание, особенно немедленное, - это один из способов уменьшить нежелательное поведение. Например, представьте, что ваш четырехлетний сын Брэндон выбегает на оживленную улицу, чтобы получить мяч. Вы даете ему тайм-аут (положительное наказание) и говорите, чтобы он больше никогда не выходил на улицу. Скорее всего, он не повторит такое поведение. Хотя сегодня такие стратегии, как тайм-ауты, распространены, в прошлом дети часто подвергались физическому наказанию, например, порке. Важно знать о некоторых недостатках применения физического наказания к детям. Во-первых, наказание может научить страху. Брэндон может бояться улицы, но он также может бояться человека, который вынес наказание - вас, его родителя. Точно так же дети, которых наказывают учителя, могут начать бояться учителя и пытаться избегать школы (Gershoff et al., 2010). Следовательно,в большинстве школ США телесные наказания запрещены. Во-вторых, наказание может привести к тому, что дети станут более агрессивными и склонными к антиобщественному поведению и правонарушениям (Gershoff, 2002). Они видят, как их родители прибегают к порке, когда они злятся и расстраиваются, поэтому, в свою очередь, они могут вести себя так же, когда становятся злыми и разочарованными. Например, из-за того, что вы шлепаете Бренду, когда злитесь на нее за ее проступки, она может начать бить своих друзей, когда они не хотят делиться своими игрушками.они могут вести себя так же, когда становятся злыми и разочарованными. Например, из-за того, что вы шлепаете Бренду, когда злитесь на нее за ее проступки, она может начать бить своих друзей, когда они не хотят делиться своими игрушками.они могут вести себя так же, когда становятся злыми и разочарованными. Например, из-за того, что вы шлепаете Бренду, когда злитесь на нее за ее проступки, она может начать бить своих друзей, когда они не хотят делиться своими игрушками.

Хотя в некоторых случаях положительное наказание может быть эффективным, Скиннер предположил, что применение наказания следует взвешивать с учетом возможных негативных последствий. Сегодняшние психологи и эксперты по воспитанию предпочитают поощрение наказанию - они рекомендуют поймать ребенка, который делает что-то хорошее, и вознаградить его за это.

Формирование

В своих экспериментах с оперантным обусловливанием Скиннер часто использовал подход, называемый формированием. Вместо того, чтобы вознаграждать только целевое поведение, при формировании мы вознаграждаем последовательные приближения целевого поведения. Зачем нужен шейпинг? Помните, что для того, чтобы подкрепление сработало, организм должен сначала продемонстрировать поведение. Формирование необходимо, потому что крайне маловероятно, что организм спонтанно проявит что-либо, кроме простейшего поведения. При формировании поведение разбивается на множество небольших достижимых шагов. В этом процессе используются следующие конкретные шаги:



Усиление любого ответа, который напоминает желаемое поведение.

Затем подкрепите ответ, который больше соответствует желаемому поведению. Вы больше не будете усиливать ранее усиленный ответ.

Затем начните усиливать реакцию, которая еще больше соответствует желаемому поведению.

Продолжайте усиливать все более близкие приближения к желаемому поведению.

Наконец, только подкрепляйте желаемое поведение.

Формирование часто используется для обучения сложному поведению или цепочке поведений. Скиннер использовал шейпинг, чтобы научить голубей не только таким относительно простым способам поведения, как клевание диска в ящик Скиннера, но и многим необычным и занимательным формам поведения, таким как поворот по кругу, ходьба восьмерками и даже игра в пинг-понг; сегодня эта техника широко используется дрессировщиками животных. Важная часть формирования - различение стимулов. Вспомните собак Павлова - он научил их реагировать на звук колокольчика, а не на похожие тоны или звуки. Это различение также важно для оперантного обусловливания и формирования поведения.

Ссылка на обучение

Вот краткое видео голубей Скиннера, играющих в пинг-понг.

Легко понять, насколько эффективен шейпинг в обучении животных поведению, но как шейпинг работает с людьми? Давайте рассмотрим родителей, цель которых - научить ребенка убирать в своей комнате. Они используют шейпинг, чтобы помочь ему освоить шаги к цели. Вместо того, чтобы выполнять всю задачу, они настраивают эти шаги и усиливают каждый шаг. Сначала он убирает одну игрушку. Во-вторых, он убирает пять игрушек. В-третьих, он выбирает, взять ли десять игрушек или убрать книги и одежду. В-четвертых, он убирает все, кроме двух игрушек. Наконец, он убирает всю свою комнату.

ПЕРВИЧНЫЕ И ВТОРИЧНЫЕ УСИЛЕНИЯ

Награды, такие как наклейки, похвала, деньги, игрушки и многое другое, могут быть использованы для усиления обучения. Вернемся снова к крысам Скиннера. Как крысы научились нажимать на рычаг в ящике Скиннера? Их наградили едой каждый раз, когда они нажимали на рычаг. Для животных еда была бы очевидным подкреплением.

Что было бы хорошим подкреплением для людей? Для вашей дочери Сидни это было обещанием игрушки, если она уберет свою комнату. Как насчет Хоакина, футболиста? Если вы будете давать Хоакину конфету каждый раз, когда он добивается цели, вы будете использовать основное подкрепление. Первичные подкрепления - это подкрепления, которые обладают врожденными укрепляющими качествами. Такого рода подкрепления не усвоены. Вода, еда, сон, кров, секс и прикосновения, среди прочего, являются основными подкрепляющими элементами. Удовольствие также является главным подкреплением. Организмы не теряют влечения к этим вещам. Для большинства людей прыжки в прохладное озеро в очень жаркий день будут укреплять, а прохладное озеро будет подкреплять от природы - вода охладит человека (физическая потребность), а также доставит удовольствие.

Вторичное подкрепление не имеет внутренней ценности и обладает только усиливающими качествами, когда связано с основным подкреплением. Хвала, связанная с привязанностью, является одним из примеров вторичного подкрепления, как, например, когда вы кричали: «Отличный выстрел!» каждый раз Хоакин забивал. Другой пример, деньги, имеют ценность только тогда, когда вы можете использовать их для покупки других вещей - либо вещей, которые удовлетворяют основные потребности (еда, вода, жилье - все основные подкрепления), либо других второстепенных подкреплений. Если бы вы были на удаленном острове посреди Тихого океана и у вас были стопки денег, деньги не пригодились бы, если бы вы не могли их потратить. А как насчет наклеек на диаграмме поведения? Они также являются вторичными усилителями.

Иногда вместо наклеек на таблице наклеек используется жетон. Жетоны, которые также являются вторичными подкреплениями, затем можно обменять на награды и призы. Целые системы управления поведением, известные как экономика токенов, построены на использовании таких усилителей токенов. Было обнаружено, что токен-экономика очень эффективна для изменения поведения в различных условиях, таких как школы, тюрьмы и психиатрические больницы. Например, исследование Канги и Дейли (2013) показало, что использование токен-экономики усиливает соответствующее социальное поведение и снижает неадекватное поведение в группе аутичных школьников. Дети с аутизмом склонны демонстрировать деструктивное поведение, такое как щипание и удары. Когда дети в исследовании проявляли соответствующее поведение (не ударяли и не щипали), они получали жетон «тихие руки».Когда они ударили или ущипнули, они теряли жетон. Затем дети могли обменять определенное количество жетонов на минуты игрового времени.

Родители и учителя часто используют модификацию поведения, чтобы изменить поведение ребенка. Модификация поведения использует принципы оперантного обусловливания для изменения поведения, так что нежелательное поведение заменяется более социально приемлемым. Некоторые учителя и родители составляют таблицу с наклейками, в которой перечислены несколько моделей поведения. Таблицы с наклейками - это форма экономии токенов, как описано в тексте. Каждый раз, когда дети выполняют такое поведение, они получают наклейку, а после определенного количества наклеек - приз или поощрение. Цель состоит в том, чтобы повысить допустимое поведение и уменьшить проступки. Помните, что лучше подкреплять желаемое поведение, чем применять наказание. В классе учитель может закрепить широкий спектр форм поведения, от поднятия рук учащимися до тихой прогулки по коридору,сдавать домашнее задание. Дома родители могут создать диаграмму поведения, которая вознаграждает детей за такие вещи, как убирание игрушек, чистка зубов и помощь с ужином. Чтобы модификация поведения была эффективной, подкрепление должно быть связано с поведением; подкрепление должно иметь значение для ребенка и осуществляться последовательно.

Таблицы наклеек - это форма положительного подкрепления и инструмент для изменения поведения. Как только эта маленькая девочка заработает определенное количество наклеек за демонстрацию желаемого поведения, она будет вознаграждена поездкой в ​​кафе-мороженое. (кредит: Эбигейл Батчелдер)

Тайм-аут - еще один популярный метод, используемый для модификации поведения детей. Он действует по принципу отрицательного наказания. Когда ребенок демонстрирует нежелательное поведение, он отстраняется от желаемого занятия. Например, скажем, что София и ее брат Марио играют со строительными блоками. София бросает несколько блоков в своего брата, поэтому вы предупреждаете ее, что у нее будет тайм-аут, если она сделает это снова. Через несколько минут она бросает еще несколько блоков в Марио. Вы убираете Софию из комнаты на несколько минут. Когда она возвращается, она не бросает блоки.

Есть несколько важных моментов, которые вам следует знать, если вы планируете использовать тайм-аут как метод модификации поведения. Во-первых, убедитесь, что ребенка отстранили от желаемого занятия и поместили в менее желательное место. Если занятие является чем-то нежелательным для ребенка, этот прием будет иметь неприятные последствия, потому что ребенку приятнее отстраниться от занятия. Во-вторых, важна продолжительность тайм-аута. Общее практическое правило - одна минута на каждый год возраста ребенка. Софии пять лет; поэтому она сидит в тайм-ауте пять минут. Установка таймера помогает детям узнать, как долго им нужно сидеть во время перерыва. Наконец, как воспитатель помните о нескольких рекомендациях в течение тайм-аута: сохраняйте спокойствие, направляя ребенка на тайм-аут;игнорируйте своего ребенка во время перерыва (потому что внимание воспитателя может усилить плохое поведение); и по окончании тайм-аута обнять ребенка или доброе слово.

Тайм-аут - это популярная форма негативного наказания, которую используют опекуны. Когда ребенок плохо себя ведет, его или ее отстраняют от желаемого занятия, чтобы уменьшить нежелательное поведение. Например, (а) ребенок может играть на детской площадке с друзьями и толкать другого ребенка; (б) ребенок, который плохо себя вел, будет отстранен от занятия на короткий период времени. (кредит а: модификация работы Симоне Рамелла; кредит б: модификация работы «JefferyTurner» / Flickr)

ГРАФИК УСИЛЕНИЯ

Помните, лучший способ научить человека или животное поведению - использовать положительное подкрепление. Например, Скиннер использовал положительное подкрепление, чтобы научить крыс нажимать на рычаг в ящике Скиннера. Сначала крыса могла случайным образом нажать на рычаг, исследуя коробку, и из нее вылезла гранула с едой. Как вы думаете, что сделала голодная крыса после того, как съела гранулы? Он снова ударил по рычагу и получил еще одну лепешку с едой. Каждый раз, когда крыса ударяла по рычагу, из нее выходила лепешка с едой. Когда организм получает подкрепление каждый раз, когда он демонстрирует поведение, это называется постоянным подкреплением. Этот график подкрепления - самый быстрый способ научить кого-то поведению, и он особенно эффективен при обучении новому поведению. Давайте вернемся к собаке, которая училась сидеть ранее в этой главе. Теперь каждый раз, когда он сидит,вы угощаете его. Здесь важен выбор времени: вы добьетесь наибольшего успеха, если представите поощрение сразу после того, как он сядет, чтобы он мог связать целевое поведение (сидение) и последствия (получение угощения).

После обучения поведению исследователи и инструкторы часто обращаются к другому типу графика подкрепления - частичному подкреплению. При частичном подкреплении, также называемом периодическим подкреплением, человек или животное не получают подкрепления каждый раз, когда они выполняют желаемое поведение. Существует несколько различных типов расписаний частичного армирования. Эти графики описываются как фиксированные или переменные, а также как интервальные или пропорциональные. Фиксированное относится к количеству ответов между подкреплениями или количеству времени между подкреплениями, которое установлено и не изменяется. Переменная относится к количеству ответов или времени между подкреплениями, которое варьируется или изменяется. Интервалозначает, что расписание основано на времени между подкреплениями, а соотношение означает, что расписание основано на количестве ответов между подкреплениями.

Графики армирования График подкрепления Описание Результат Пример
Фиксированный интервал Армирование доставляется через предсказуемые интервалы времени (например, через 5, 10, 15 и 20 минут). Умеренная реакция со значительными паузами после подкрепления Пациент в больнице использует обезболивающее под контролем врача и под контролем врача.
Переменный интервал Армирование доставляется через непредсказуемые промежутки времени (например, через 5, 7, 10 и 20 минут). Умеренная, но стабильная скорость отклика Проверка Facebook
Фиксированный коэффициент Подкрепление доставляется после предсказуемого количества ответов (например, после 2, 4, 6 и 8 ответов). Высокая скорость отклика с паузами после подкрепления Сдельная работа - заводскому рабочему платят за каждое x количество произведенных изделий.
Переменное соотношение Подкрепление доставляется после непредсказуемого количества ответов (например, после 1, 4, 5 и 9 ответов). Высокая и стабильная скорость отклика Играть в азартные игры

Теперь давайте объединим эти четыре термина. График подкрепления с фиксированным интервалом - это когда поведение вознаграждается по прошествии определенного времени. Например, Джун перенесла серьезную операцию в больнице. Ожидается, что во время выздоровления она будет испытывать боль, и ей потребуются рецептурные лекарства для снятия боли. Джун делают капельницу с контролируемым пациентом обезболивающим. Ее врач устанавливает лимит: одна доза в час. Джун нажимает кнопку, когда боль становится тяжелой, и она получает дозу лекарства. Поскольку вознаграждение (облегчение боли) происходит только в фиксированный промежуток времени, нет смысла демонстрировать поведение, когда оно не будет вознаграждено.

С графиком подкрепления с переменным интервалом, человек или животное получают подкрепление в зависимости от различных периодов времени, которые непредсказуемы. Допустим, Мануэль - менеджер в ресторане быстрого питания. Время от времени в ресторан Мануэля приходит кто-нибудь из отдела контроля качества. Если в ресторане чисто и обслуживают быстро, каждый в эту смену получает бонус в размере 20 долларов. Мануэль никогда не знает, когда появится специалист по контролю качества, поэтому он всегда старается содержать ресторан в чистоте и гарантирует, что его сотрудники обеспечат быстрое и вежливое обслуживание. Его продуктивность в отношении быстрого обслуживания и содержания в чистоте ресторана стабильна, потому что он хочет, чтобы его команда заработала премию.

При фиксированном соотношении подкреплений есть определенное количество ответов, которые должны произойти, прежде чем поведение будет вознаграждено. Карла продает очки в магазине очков и получает комиссию за каждую продажу очков. Она всегда пытается продать людям больше пар очков, в том числе солнцезащитные очки по рецепту или запасную пару, чтобы увеличить свою комиссию. Ей все равно, действительно ли человеку нужны солнцезащитные очки по рецепту, Карла просто хочет получить свой бонус. Качество того, что продает Карла, не имеет значения, потому что ее комиссия не зависит от качества; он основан только на количестве проданных пар. Это различие в качестве исполнения может помочь определить, какой метод усиления лучше всего подходит для конкретной ситуации. Фиксированные коэффициенты лучше подходят для оптимизации объема выпуска, тогда как фиксированный интервалв котором вознаграждение не зависит от количества, может привести к более высокому качеству продукции.

В графике подкрепления с переменным соотношением количество ответов, необходимых для получения награды, варьируется. Это наиболее эффективный график частичного подкрепления. Примером графика подкрепления с переменным соотношением является азартная игра. Представьте себе, что Сара - обычно умная и бережливая женщина - впервые приезжает в Лас-Вегас. Она не игрок, но из любопытства кладет в игровой автомат четвертак, потом еще и еще. Ничего не произошло. Через два доллара через квартал ее любопытство угасает, и она вот-вот бросит курить. Но затем загорается автомат, звенит звонок, и Саре возвращается 50 четвертей. Это больше походит на это! Сара возвращается к вставке четвертаков с новым интересом, и через несколько минут она израсходовала всю свою прибыль и заработала 10 долларов. Возможно, сейчас самое подходящее время, чтобы бросить курить. И все еще,она продолжает вкладывать деньги в игровой автомат, потому что никогда не знает, когда придет следующее подкрепление. Она все время думает, что в следующем квартале она может выиграть 50, 100 долларов или даже больше. Поскольку график подкрепления в большинстве видов азартных игр имеет переменное соотношение, люди продолжают пытаться и надеяться, что в следующий раз они выиграют по-крупному. Это одна из причин того, что азартные игры вызывают такое привыкание и такое сопротивление исчезновению.

При оперантном обусловливании исчезновение подкрепляемого поведения происходит в какой-то момент после прекращения подкрепления, и скорость, с которой это происходит, зависит от графика подкрепления. В графике с переменным соотношением точка вымирания наступает очень медленно, как описано выше. Но в других графиках подкрепления исчезновение может наступить быстро. Например, если Джун нажимает кнопку обезболивающего до назначенного времени, одобренного ее врачом, лекарства не вводятся. Она находится на графике подкрепления с фиксированным интервалом (дозируется ежечасно), поэтому вымирание происходит быстро, когда подкрепление не приходит в ожидаемое время. Среди графиков подкрепления переменное соотношение является наиболее продуктивным и наиболее устойчивым к исчезновению. Фиксированный интервал наименее продуктивен и его легче всего погасить ([ссылка]).

Четыре графика подкрепления дают разные модели реакции. График с переменным соотношением непредсказуем и дает высокие и устойчивые показатели отклика с небольшой паузой после поощрения (например, игрок). График с фиксированным соотношением предсказуем и дает высокую скорость отклика с короткой паузой после подкрепления (например, продавщица очков). График с переменными интервалами непредсказуем и обеспечивает умеренную и стабильную реакцию (например, менеджер ресторана). График с фиксированными интервалами дает образец реакции в форме гребешка, отражающий значительную паузу после подкрепления (например, хирургический пациент).

Соедините концепции: азартные игры и мозг

Скиннер (1953) заявил: «Если игорное заведение не может убедить патрона отдать деньги без возврата, оно может достичь того же эффекта, вернув часть денег патрона по графику с переменным соотношением» (стр. 397).

Скиннер использует азартные игры как пример силы и эффективности обусловливающего поведения, основанного на графике подкрепления с переменным соотношением. Фактически, Скиннер был настолько уверен в своих знаниях об игровой зависимости, что даже утверждал, что может превратить голубя в патологического игрока («Утопия Скиннера», 1971). Помимо силы подкрепления с переменным соотношением, азартные игры, похоже, воздействуют на мозг так же, как и некоторые наркотики, вызывающие зависимость. Иллинойский институт восстановления от зависимости (nd) сообщает о доказательствах, свидетельствующих о том, что патологическая азартная игра является зависимостью, аналогичной химической зависимости. В частности, азартные игры могут активировать центры вознаграждения в мозгу, как это делает кокаин. Исследования показали, что у некоторых патологических игроков уровень нейротрансмиттера (химического вещества мозга), известного как норэпинефрин, ниже, чем у нормальных игроков (Рой,и др., 1988). Согласно исследованию, проведенному Алеком Роем и его коллегами, норэпинефрин выделяется, когда человек испытывает стресс, возбуждение или волнение; Патологические игроки используют азартные игры, чтобы повысить уровень этого нейромедиатора. Другой исследователь, нейробиолог Ганс Брайтер, провел обширное исследование азартных игр и их влияния на мозг. Брейтер (цитируется по Franzen, 2001) сообщает, что «денежное вознаграждение в эксперименте, похожем на азартные игры, вызывает активацию мозга, очень похожую на ту, которая наблюдается у кокаинового наркомана, получающего вливание кокаина» (пункт 1). Недостаток серотонина (другого нейромедиатора) также может способствовать компульсивному поведению, включая зависимость от азартных игр.Патологические игроки используют азартные игры, чтобы повысить уровень этого нейромедиатора. Другой исследователь, нейробиолог Ганс Брайтер, провел обширное исследование азартных игр и их влияния на мозг. Брейтер (цитируется по Franzen, 2001) сообщает, что «денежное вознаграждение в эксперименте, похожем на азартные игры, вызывает активацию мозга, очень похожую на ту, которая наблюдается у кокаинового наркомана, получающего вливание кокаина» (пункт 1). Недостаток серотонина (другого нейромедиатора) также может способствовать компульсивному поведению, включая зависимость от азартных игр.Патологические игроки используют азартные игры, чтобы повысить уровень этого нейромедиатора. Другой исследователь, нейробиолог Ганс Брейтер, провел обширное исследование азартных игр и их влияния на мозг. Брейтер (цитируется по Franzen, 2001) сообщает, что «денежное вознаграждение в эксперименте, похожем на азартные игры, вызывает активацию мозга, очень похожую на ту, которая наблюдается у кокаинового наркомана, получающего вливание кокаина» (пункт 1). Недостаток серотонина (другого нейромедиатора) также может способствовать компульсивному поведению, включая зависимость от азартных игр.2001) сообщает, что «денежное вознаграждение в эксперименте, похожем на азартные игры, вызывает активацию мозга, очень похожую на ту, которая наблюдается у кокаинового наркомана, получающего вливание кокаина» (пункт 1). Недостаток серотонина (другого нейромедиатора) также может способствовать компульсивному поведению, включая зависимость от азартных игр.2001) сообщает, что «денежное вознаграждение в эксперименте, похожем на азартные игры, вызывает активацию мозга, очень похожую на ту, которая наблюдается у кокаинового наркомана, получающего вливание кокаина» (пункт 1). Недостаток серотонина (другого нейромедиатора) также может способствовать компульсивному поведению, включая зависимость от азартных игр.

Возможно, мозг патологических игроков отличается от мозга других людей, и, возможно, это различие каким-то образом могло привести к их игровой зависимости, как, кажется, предполагают эти исследования. Однако установить причину очень сложно, потому что невозможно провести настоящий эксперимент (было бы неэтично пытаться превратить случайно назначенных участников в проблемных игроков). Следовательно, возможно, что причинно-следственная связь на самом деле движется в противоположном направлении - возможно, игра каким-то образом изменяет уровни нейротрансмиттеров в мозгу некоторых игроков. Также возможно, что какой-то упускаемый из виду фактор или смешивающая переменная сыграли роль как в игровой зависимости, так и в различиях в химии мозга.

Некоторые исследования показывают, что патологические игроки используют азартные игры, чтобы компенсировать аномально низкий уровень гормона норадреналина, который связан со стрессом и выделяется в моменты возбуждения и острых ощущений. (кредит: Тед Мерфи)

ПОЗНАНИЕ И СКРЫТОЕ ОБУЧЕНИЕ

Хотя строгие бихевиористы, такие как Скиннер и Ватсон, отказывались верить, что познание (например, мысли и ожидания) играет роль в обучении, другой бихевиорист, Эдвард К. Толмен, придерживался другого мнения. Эксперименты Толмена с крысами продемонстрировали, что организмы могут обучаться, даже если они не получают немедленного подкрепления (Tolman & Honzik, 1930; Tolman, Ritchie & Kalish, 1946). Этот вывод противоречил преобладающей в то время идее о том, что подкрепление должно быть немедленным, чтобы обучение могло происходить, что предполагает когнитивный аспект обучения.

В экспериментах Толмен помещал голодных крыс в лабиринт без вознаграждения за то, что они пробирались через него. Он также изучил группу сравнения, которая была вознаграждена едой в конце лабиринта. Когда крысы без армирования исследовали лабиринт, они разработали когнитивную карту: мысленную картину расположения лабиринта. После 10 сеансов в лабиринте без подкрепления пищу помещали в коробку ворот в конце лабиринта. Как только крысы узнали о еде, они смогли быстро найти путь через лабиринт, так же быстро, как и группа сравнения, которая все время была вознаграждена едой. Это известно как латентное обучение: обучение, которое происходит, но не наблюдается в поведении, пока не появится причина его продемонстрировать.

Психолог Эдвард Толман обнаружил, что крысы используют когнитивные карты, чтобы перемещаться по лабиринту. Вы когда-нибудь проходили различные уровни в видеоигре? Вы узнали, когда повернуть налево или направо, двигаться вверх или вниз. В этом случае вы полагались на когнитивную карту, как крысы в ​​лабиринте. (кредит: модификация работы «FutUndBeidl» / Flickr)

Скрытое обучение также встречается у людей. Дети могут учиться, наблюдая за действиями своих родителей, но демонстрируют это только позже, когда усвоенный материал понадобится. Например, предположим, что отец Рави каждый день возит его в школу. Таким образом, Рави узнает маршрут от своего дома до школы, но сам никогда не ехал туда, поэтому у него не было возможности продемонстрировать, что он выучил дорогу. Однажды утром отцу Рави нужно рано уйти на встречу, поэтому он не может отвезти Рави в школу. Вместо этого Рави следует на своем велосипеде по тому же маршруту, по которому его отец проехал бы на машине. Это демонстрирует скрытое обучение. Рави выучил дорогу в школу, но раньше ему не нужно было демонстрировать эти знания.

Повседневная связь: это место похоже на лабиринт

Вы когда-нибудь заблудились в здании и не могли найти выход? Хотя это может расстраивать, вы не одиноки. Рано или поздно мы все заблудились в таких местах, как музей, больница или университетская библиотека. Каждый раз, когда мы отправляемся в новое место, мы строим мысленное представление - или когнитивную карту - этого места, как крысы Толмена строили когнитивную карту своего лабиринта. Тем не менее, некоторые здания сбивают с толку, потому что в них есть много похожих друг на друга областей или мест с короткой видимости. Из-за этого часто бывает сложно предугадать, что за углом, или решить, повернуть налево или направо, чтобы выбраться из здания. Психолог Лаура Карлсон (2010) предполагает, что то, что мы помещаем на нашу когнитивную карту, может повлиять на наш успех в навигации по окружающей среде. Она предлагает обратить внимание на особенности при входе в здание,например изображение на стене, фонтан, статуя или эскалатор, добавляет информацию на нашу когнитивную карту, которую можно использовать позже, чтобы найти выход из здания.

Резюме

Оперантное кондиционирование основано на работе Б.Ф. Скиннера. Оперантное обусловливание - это форма обучения, при которой мотивация поведения возникает после того, как поведение демонстрируется. Животное или человек получают последствия после выполнения определенного поведения. Следствие - либо подкрепление, либо каратель. Любое подкрепление (положительное или отрицательное) увеличивает вероятность поведенческой реакции. Любое наказание (положительное или отрицательное) снижает вероятность поведенческой реакции. Несколько типов графиков подкрепления используются для поощрения поведения в зависимости от установленного или переменного периода времени.