Warunkowanie instrumentalne

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Warunkowanie instrumentalne (ang. operant conditioning) zwane jest także warunkowaniem sprawczym. Jest to forma uczenia się o konsekwencjach, która polega na modyfikowaniu frekwencji pojawiania się jakiegoś zachowania poprzez jego nagradzanie lub karanie. Relacja między zachowaniem a jego konsekwencją została nazwana przez Thorndike’a prawem efektu (ang. law of effect), które wskazuje na dwie zależności: wystąpienie w przyszłości reakcji, po której następują satysfakcjonujące konsekwencje, staje się bardziej prawdopodobna, zaś reakcji, po której następują niezadowalające konsekwencje, mniej prawdopodobne. Pierwszymi badaczami warunkowania instrumentalnego byli Jerzy Konorski oraz Stefan Miller, lecz najbardziej znanymi badaczami byli B. F. Skinner, Edward Thorndike,Edward Tolman.

Rys historyczny[edytuj | edytuj kod]

Za twórcę procedur warunkowania instrumentalnego przyjmuje się B.F. Skinner’a, uważał on, że czynnikami najsilniej wpływającymi na zachowanie są jago konsekwencje, czyli to, co następuje bezpośrednio po zachowaniu. Jednak nie był on pierwszym psychologiem, który zwrócił na koncepcję nagród i kar uwagę. Swoją ideę Skinner zapożyczył od Edwarda Thorndike’a, który w swoich eksperymentach nad zwierzętami zwrócił uwagę na prawo efektu. Bazując na wynikach Thornidke’a – Skinner oczyścił je z subiektywnych i nienaukowych spekulacji na temat uczuć, zamiarów czy celów organizmu. Jako radykalny behawiorysta, Skinner odrzucił myślenie o tym, co dzieje się w psychice danego organizmu, ponieważ nie możliwe było to do sprawdzenia podczas obserwacji.

Technikę wzmacniania Skinner opracował przy użyciu „komory sprawczej” zwanej również skrzynką Skinner'a, w której znajdowała się dźwignia przy naciśnięciu której zwierzę otrzymywało pokarm. Jej główną zaletą była możliwość kontrolowania układu wzmocnień, czasu i częstości występowania, które to czynniki wywierają znaczny wpływ na zachowanie.

Wzmocnienia i kary[edytuj | edytuj kod]

W otaczającym świecie możemy spotkać trzy rodzaje bodźców: apetytywne, obojętne i awersyjne. W warunkowaniu sprawczym wykorzystywane są bodźce apetytywne i awersyjne, które mogą modyfikować częstotliwość późniejszych zachowań.

Wzmocnienie to podanie czynnika wzmacniającego po wykonaniu reakcji, który zwiększy prawdopodobieństwo jej ponownego wystąpienia. W przypadku wzmocnienia pozytywnego po pewnym zachowaniu następuje podanie bodźca apetytywnego np. osoba będzie opowiadała żarty, gdy ich konsekwencją będzie śmiech słuchaczy, który jest dla jednostki wyrazem uznania. Wzmocnienie negatywne opiera się na usunięciu bodźca awersyjnego po danym zachowaniu osobnika. Są dwa główne rodzaje sytuacji uczenia się, w których zastosowanie ma to wzmocnienie, a są to: warunkowanie ucieczki i warunkowanie unikania. W warunkowaniu ucieczki organizm uczy się reakcji, która pozwala oddalić się od awersyjnego bodźca. Przykładem tego warunkowania może być otworzenie parasola podczas ulewy, który ochroni nas przed zimnymi kroplami deszczu. Warunkowanie unikania z kolei polega na tym, że organizm uczy się reakcji, które pomogą mu zapobiec awersyjnym bodźcom, zanim jeszcze zaczną one działać. Na podstawie tej teorii powstały nieprzyjemne brzęczki w samochodach, które wydają nieprzyjemny dźwięk dopóki pasażer nie zapnie pasów bezpieczeństwa. W ten sposób jednostka nauczy się zapinać pasy, aby uniknąć nieprzyjemnego dźwięku. Wzmocnienia negatywne i pozytywne zwiększają prawdopodobieństwo reakcji, która je poprzedza. Karanie polega na podaniu czynnika karzącego po danej reakcji, które ma zmniejszyć częstotliwość jej występowania. Karanie pozytywne występuje wtedy, gdy po danym zachowaniu następuje podanie bodźca awersyjnego. Przykładem może być dotknięcie gorącej kuchenki, które powoduje ból, który w tym przypadku jest karą za poprzedzającą go reakcję. Skutkiem tej kary jest mniejsze prawdopodobieństwo dotknięcia gorącej kuchenki ponownie. Natomiast kiedy po pewnym zachowaniu następuje usunięcie bodźca apetytywnego, mamy do czynienia z karaniem negatywnym. Kiedy na przykład rodzice odbiorą synowi kieszonkowe za to, że uderzył swoją młodszą siostrzyczkę, chłopczyk prawdopodobnie więcej tego nie uczyni. Karanie zawsze zmniejsza prawdopodobieństwo, że dana reakcja wystąpi ponownie, a wzmocnienie zawsze to prawdopodobieństwo zwiększa. Należy także pamiętać, że słowa „pozytywne” i „negatywne” łączą się odpowiednio ze słowami „podaj” i „usuń” a nie z ich pozytywną czy negatywną konsekwencją.

Wzorce związków między zachowaniem a wzmocnieniem[edytuj | edytuj kod]

Czyli ustalenie związków między reakcją, a zmianami w sytuacji, które następują po tej reakcji.

Możliwe sposoby łączenia reakcji z czynnikami wzmacniającymi[edytuj | edytuj kod]

Wzmocnienia ciągłe jest to typ rozkładu wzmocnień, w którym wzmacnianie są wszystkie poprawne reakcje. Użyteczny sposób na początku procesu uczenie się, ponieważ pojawiająca się nagroda za poprawną reakcję i jej brak za niepoprawną są informacją zwrotną. Znajduje on też zastosowanie w procesie kształtowania- technika uczenia się sprawczego, która prowadzi do pojawienia się nowych zachowań, poprzez wzmacnianie reakcji podobnych do reakcji pożądanej( np. nauka czytania w szkole). Negatywną stroną tego rozkładu jest, fakt, że każde, jednorazowe nienagrodzenie pozytywnej reakcji, prowadzi do interpretacji, że jest ona reakcją niepoprawną. Ponadto wraz z coraz większym nasyceniem organizmu nagrodami, maleje ich moc sprawcza. Wzmocnienia sporadyczne zwane także wzmocnieniem częściowym jest to typ rozkładu wzmocnienia, w którym wzmacnianie są niektóre, lecz nie wszystkie reakcje poprawne, stosowany, gdy pożądana reakcja została już dobrze wyuczona. Taki rozkład wzmocnień jest najskuteczniejszym sposobem na podtrzymania wyuczonych wcześniej zachowań. Jego zaletą jest odporność na wygaszanie czyli proces, w którym wyuczona reakcja zostaje osłabiona, ze względu na brak wzmocnień. Wzmocnienie sporadyczne może przebiegać w dwóch głównych formach w rozkładzie stosunkowym i rozkładzie interwałowym. Rozkład stosunkowy to taki program , w którym nagroda pojawia się po jakiejś liczbie poprawnych reakcji. Można wyróżnić dwie subkategorie w obrębie tego konstrukt: rozkłady wzmocnień według stałych proporcji, gdzie wzmocnienie pojawia się po pewnej niezmiennej liczbie poprawnych reakcji oraz rozkłady wzmocnień według zmiennych proporcji, gdzie liczba reakcji potrzebnych do uzyskania wzmocnienia zmienia się z próby na próbę. Druga możliwą formą są rozkłady interwałowe, gdzie pojawianie się wzmocnienia zależy od czasu, jaki upłyną od ostatniego wzmocnienia. Istnieją dwie formy takiego rozkładu. Pierwszą z nich są rozkłady wzmocnienia o stałych odstępach czasowych, gdzie nagroda pojawia się po upływie stałego czasu. Drugą zaś są rozkłady wzmocnienia o zmiennych odstępach czasowych, w których wzmocnienie pojawia się po pewnym czasie, który zmienia się z próby na próbę.

Bibliografia[edytuj | edytuj kod]

  • Gerrig, R.I., Zimbardo, P. G. (2009). Psychologia i życie. Warszawa: Wydawnictwo Naukowe PWN.
  • Konorski J., Integracyjna działalność mózgu, Warszawa 1969
  • Zimbardo, P. G., Johnson, R. L., & McCann, V. (2010). Psychologia: kluczowe koncepcje. Motywacja i uczenie się. Warszawa: Wydawnictwo Naukowe PWN.

Zobacz też[edytuj | edytuj kod]