Psychologie
Lernmodelle
 – Video
Video anzeigen

Bei der operanten Konditionierung lernt ein Lebewesen eine bestimmte Verhaltensweise häufiger zu zeigen, indem es dafür belohnt wird. Wenn es bestraft wird, verhält es sich seltener so. Du willst die operante Konditionierung noch schneller verstehen? Schau dir doch unser Video zu dem Thema an.

Operante Konditionierung einfach erklärt  

Die operante Konditionierung ist eine bekannte Lerntheorie des Behaviorismus

Es geht darum, dass ein Mensch oder ein Tier eine bestimmte Verhaltensweise häufiger oder seltener zeigt, indem du es dafür belohnst oder bestrafst

Du gehst zum Beispiel für eine ältere Frau einkaufen (Verhaltensweise) und sie bedankt sich danach mit einer Tafel Schokolade (angenehme Konsequenz / Belohnung) bei dir. Dadurch gehst du nächste Woche wieder für sie einkaufen. Wenn du der Frau jetzt aber die Einkäufe bringst und sie beschwert sich, dass du etwas vergessen hast (unangenehme Konsequenz / Bestrafung), dann wirst du wahrscheinlich nichts mehr für sie erledigen. 

Hat eine Verhaltensweise also eine angenehme Konsequenz, wird sie öfter gezeigt. Wenn sie eine unangenehme Konsequenz hat, wird sie seltener gezeigt. Das funktioniert auch, wenn durch eine Verhaltensweise eine unangenehmen Konsequenz aufhört (Belohnung) oder eine angenehme Konsequenz verschwindet (Bestrafung). Das ist die operante Konditionierung. 

Angenehme Konsequenzen, unangenehme Konsequenzen, Skinner, Konditionieren, operant, Lerntheorie
direkt ins Video springen
Operante Konditionierung

 

Die Definition für operante Konditionierung lautet wie folgt: 

Operante Konditionierung Definition  

Bei der operanten Konditionierung (englisch: Operant Conditioning) wird Einfluss auf die Auftrittshäufigkeit einer Verhaltensweise genommen. Erwünschte Verhaltensweisen werden durch angenehme Konsequenzen (Positive Verstärkung) bzw. durch das Ausbleiben unangenehmer Konsequenzen (Negative Verstärkung) belohnt. Unerwünschte Verhaltensweisen werden durch unangenehme Konsequenzen (Positive Bestrafung) bzw. durch das Ausbleiben angenehmer Konsequenzen (Negative Bestrafung) unterdrückt. 

Verstärker 

Bei der operanten Konditionierung gibt es vier Möglichkeiten ein Verhalten zu verstärken bzw. zu bestrafen. Dadurch wird ein Individuum konditioniert, ein Verhalten häufiger bzw. seltener zu zeigen. 

Hinweis

Die folgenden Begriffe haben im Zusammenhang mit der operanten Konditionierung diese Bedeutung:

  • Positiv = Vorhanden ≠ Angenehm       
  • Negativ = Abwesend ≠ Unangenehm
  • Angenehme Konsequenz = Appetetiv ≠ Positiv
  • Unangenehme Konsequenz = Aversiv ≠ Negativ

Im Folgenden betrachten wir die vier möglichen Konsequenzen einer Verhaltensweise genauer: 

Verstärkung

Bei einer Verstärkung (englisch reinforcement) soll ein erwünschtes Verhalten häufiger gezeigt werden. Um das zu erreichen, hast du bei der operanten Konditionierung zwei Möglichkeiten.

Positive Verstärkung: Das erwünschte Verhalten belohnst du mit einer angenehmen Konsequenz, indem du dem Individuum zum Beispiel Geld oder Nahrung gibst. Aber auch Achtung und Anerkennung können als positive Verstärker wirken. 

Negative Verstärkung: Du belohnst ein erwünschtes Verhalten, indem die aversiven Konsequenzen ausbleiben, wenn die Verhaltensweise gezeigt wird. Du entfernst zum Beispiel extremen Lärm oder grelles Licht vom Individuum. 

Bestrafung

Durch eine Bestrafung (englisch punishment) möchtest du ein unerwünschtes Verhalten unterdrücken. Auch hier hast du wieder zwei Möglichkeiten.

Positive Bestrafung: Du kannst das unerwünschte Verhalten bestrafen, indem dieser Verhaltensweise eine unangenehme Konsequenz folgt. Das Individuum wird zum Beispiel extremen Lärm ausgesetzt oder ein Kind bekommt Hausarrest. 

Negative Bestrafung: Das unerwünschte Verhalten kannst du auch unterdrücken, indem eine angenehme Konsequenz auf das Verhalten hin ausbleibt. Du kannst dem Individuum zum Beispiel Nahrung wegnehmen oder es nicht mehr begrüßen.

Kontingenzschema

Darstellen kannst du die vier möglichen Konsequenzen der operanten Konditionierung anhand eines sogenannten Kontingenzschemas. Hier sind die angenehmen und die unangenehmen Konsequenzen, ihr hinzufügen oder ihr entfernen und die Wirkung dargestellt. Das sieht dann so aus: 

Operante Konditionierung, Angenehme Konsequenz, Unangenehme Konsequenz, Positive Verstärkung, Negative Verstärkung, Negative Bestrafung, Positive Bestrafung
direkt ins Video springen
Kontingenzschema der operanten Konditionierung

 

Ursprung der klassischen Konditionierung: Law of effect 

Die Idee der operanten Konditionierung geht auf das Gesetz der Wirkung (engl. Law of effect) von Edward Lee Thorndike zurück. Es beschreibt, dass bei zufällig auftretenden Handlungen, die Handlungen häufiger gezeigt werden, die positive Folgen haben. 

Beispiel: Skinnerbox (Burrhus Frederic Skinner) 

Das Law of effect hat Brrrhus Frederic Skinner aufgegriffen und daraus die operante Konditionierung entwickelt. Dazu hat er die sogenannte Skinnerbox entworfen.

Die Skinnerbox ist ein Käfig, worin sich später eine Ratte befindet. Im Käfig ist ein Hebel angebracht, den die Ratte drücken kann. Außerdem gibt es eine Vorrichtung für Futter, eine Lampe und einen Boden, der unter Strom gesetzt werden kann. 

Brrrhus Frederic Skinner, Operante Konditionierung, Positive Verstärkung, Negative Verstärkung, Positive Bestrafung, Negative Bestrafung
direkt ins Video springen
Skinnerbox

 

Jetzt hat Skinner verschiedene Experimente durchgeführt. Diese schauen wir uns genauer an. 

  1. Positive Verstärkung: Die Ratte bekommt immer, wenn sie den Hebel betätigt (Verhalten), Futter (Angenehme Konsequenz). Dadurch zeigt sie das Verhalten häufiger.
  2. Negative Verstärkung: Der Käfigboden der Ratte steht ständig unter Strom. Wenn die Ratte jetzt den Hebel drückt (Verhalten), geht der Strom aus (unangenehme Konsequenz bleibt aus). Sie verhält sich öfter so. 
  3. Positive Bestrafung:  Die Ratte bekommt immer einen Stromschlag (Unangenehme Konsequenz), wenn sie den Hebel (Verhalten) drückt. Das führt dazu, dass sie das Verhalten seltener zeigt. 
  4. Negative Bestrafung: Die vierte Möglichkeit hat Skinner nicht durchgeführt, dabei würde der Ratte immer das Futter weggenommen werden (angenehme Konsequenz bleibt aus), wenn sie den Hebel (Verhalten) drückt. Sie vermeidet daraufhin das Verhalten. 

Im nächsten Schritt hat er einer Ratte jetzt noch beigebracht, dass sei nur dann Futter bekommt (Angenehme Konsequenz) , wenn sie den Hebel drückt (Verhalten), während die Lampe im Käfig leuchtet (Stimulus). Du kannst also ein Verhalten auch an eine bestimmte Bedienung oder Situation knüpfen. 

Die Skinnerbox ist ein wichtiges Beispiel für das operante Konditionieren, schauen wir uns jetzt an, was du im allgemeinen zu den Verstärkern bei der operanten Konditionierung wissen solltest.

Zeitliches Auftreten der Verstärker 

Grundsätzlich können Verstärker können unterschiedlich oft auftreten. Häufig wird ein Verstärkerplan verwendet. Dabei kannst du die folgenden Methoden unterscheiden. 

Kontinuierliche Verstärker / Immer-Verstärker:

Jedes Mal, wenn das erwünschte Verhalten auftritt, belohnst du es. Bei dieser Art der Verstärkung lernt das Individuum zwar schnell und zeigt das Verhalten häufig. Es verlernt es allerdings auch genauso schnell wieder.

Beispiel: Du wirst für jeden Handgriff im Haushalt gelobt. 

Intermittierende Verstärkung / Manchmal-Verstärkung / Partielle Verstärkung: 

Hier wird das Verhalten nur hin und wieder verstärkt. Dadurch dauert das operante Lernen zwar länger, aber es ist auch nachhaltiger. Das erwünschte Verhalten wird als längerfristig häufiger gezeigt. 

Beispiel: Du sagst einer Köchin, dass das Essen heute besonders gut geschmeckt hat. 

Die intermittierende Verstärkung kannst du nochmal gliedern in:

  • Quotenverstärkung: Es wird zum Beispiel jedes 10. Mal das erwünschte Veralten verstärkt.
  • Intervallverstärkung: Es wird zum Beispiel pro Stunde drei Mal verstärkt, wenn du das Individuum also in den ersten zehn Minuten drei Mal lobst, dann darfst du es die restlichen 50 Minuten nicht mehr loben.

Arten von Verstärkern

Als Verstärker können verschiedene Gegenstände und Handlungen dienen. Du kannst bei der operanten Konditionierung nochmal wie folgt unterscheiden:

  • Primäre Verstärker: Sie befriedigen physiologische Bedürfnisse, wie Nahrung oder Trinken.
  • Sekundäre Verstärker: Sie sind nicht lebensnotwendig. Du hast bereits gelernt, dass sie erstrebenswert sind wie Lob, gute Noten, die Erlaubnis oder Befugnis für etwas.
  • Materielle Verstärker: Dazu zählst du alle Gegenstände, die mit materiellem Aufwand verbunden sind wie Blumen und Schokolade, aber auch Geld und Gehalt. 
  • Handlungsverstärker: Du belohnst mit einer angenehmen Tätigkeit, wie einem Kinobesuch oder mit andere Freizeitaktivitäten.
  • Soziale Verstärker: Belohnung durch angenehmen zwischenmenschlichen Kontakt, wie Lob, Beifall, Anlächeln oder Anerkennung. 

Wie du gerade gesehen hast, kann ein Verstärker zu mehreren Kategorien gehören. 

Operante Konditionierung, Primärer Verstärker, Sekundäre Verstärker, Materielle Verstärker, Handlungsverstärker, Soziale Verstärker
direkt ins Video springen
Arten von Verstärker

 

Wirksamkeit der Verstärker

Die einzelnen möglichen Verstärker sind unterschiedlich wirksam. Das heißt, dass durch einen Verstärker ein Individuum die Verhaltensweise schneller lernt als mit einem anderen Verstärker. Die Wirksamkeit des Verstärkers der operanten Konditionierung ist von Folgendem abhängig: 

  • Person (Bsp. ein Schoko-Liebhaber freut sich über eine Tafel Schokolade stärker als jemand, der keine Süßigkeiten mag)
  • Situation (Bsp. Wenn du gerade schon eine Tafel Schokolade als Belohnung bekommen hast, freust du dich über eine zweite deutlich weniger)
  • Kultur und Sozialisation (Bsp. Prestige und Reichtum ist zum Beispiel in den unterschiedlichen Kulturen und in den unterschiedlichen sozialen Schichten unterschiedlich angesehen)
  • Lobende Person (Bsp. Du freust dich mehr, wenn du von deinem Trainer gelobt wirst als wenn dich jemand lobt, der weniger Erfahrung hat)
  • Zeit (Bsp. Wenn du eine Tafel Schokolade für eine bestimmte Verhaltensweise bekommst, bringt es mehr, wenn du sie unmittelbar nach den Verhalten bekommst, als wenn sie dir ein Jahr später überreicht wird)
Operante Konditionierung, Verstärker, Person, Situation, Kultur, Sozialisation, Lobende Person, Zeit
direkt ins Video springen
Wirksamkeit der Verstärker

 

Lernen durch Bestrafung 

Wenn du möchtest, dass unerwünschtes Verhalten seltener oder gar nicht auftritt, dann bestrafst du es bei der operanten Konditionierung. Dadurch verstärkst du aber nicht das erwünschte Verhalten, sondern schwächst nur das unerwünschte Verhalten ab. Diese Verhaltensweise wird also kurzfristig nicht mehr gezeigt und unterdrückt. Langfristig tritt sie aber wahrscheinlich wieder auf. 

Extinktion und spontane Erholung

Wenn eine Verhaltensweise einmal gelernt ist, bleibt die Belohnung häufig aus. Das führt aber zur Extinktion (=Löschung) der Verhaltensweise. Das heißt also, dass du die erlernte Verhaltensweise wieder „verlernst„. Das erwünschte Verhalten wird dadurch seltener gezeigt, wenn es nicht mehr belohnt wird.

Es kann aber auch sein, dass die Verhaltensweise ohne Verstärkung erst mal übermäßig auftritt, weil die angenehmen Konsequenzen so ungeduldig eingefordert werden. Nach einiger Zeit legt sich aber auch das und die Verhaltensweise wird nicht mehr absichtlich gezeigt. 

Eine andere Möglichkeit, wie ein Individuum das ausbleiben eines Verstärkers auffassen kann, ist, dass es als Bestrafung interpretiert wird. Dadurch wird das Verhalten noch schneller „verlernt“.

Unabhängig davon, wie die Extinktion verläuft, tritt häufig dieses Phänomen auf: Das Verhalten wird nach einiger Zeit einfach trotzdem spontan und grundlos wieder gezeigt, ohne dass es nochmal verstärkt wurde. Nimmt dann aber auch wieder ab. Das nennst du spontane Erholung

Operante Konditionierung, Verlauf, Verstärkung, Verstärker, Verlernen
direkt ins Video springen
Extinktion & spontane Erholung

 

Shaping

Die operante Konditionierung wird beim sogenannten Shaping angewandt. Darunter verstehst du die stufenweise Annäherung an eine erwünschte komplexere Verhaltensweise. Die Methode wird häufig bei der Dressur von Tieren verwendet.

Du möchtest zum Beispiel deinem Pferd durch Shaping beibringen, dass es über eine größere Entfernung zu dir kommt, wenn du es rufst. Dazu stellst du dich als erstes nur einen Meter vom Pferd weg und rufst es. Wenn es kommt, lobst du es. Das führst du ein paar Mal so durch, bis es immer zu dir geht. Als nächstes entfernst du dich etwas weiter und machst das gleiche. Mit der Zeit vergrößerst du dann  Schritt für Schritt den Abstand. Du lobst das Pferd jetzt nur noch, wenn es mit großem Abstand zu dir kommt. 

Operante Konditionierung, Dressur, Training, Verstärken, Belohnung, loben
direkt ins Video springen
Shaping

 

Abgrenzung instrumentelle Konditionierung 

Die instrumentelle Konditionierung wird oft mit der operanten Konditionierung gleichgesetzt und die Begriffe werden synonym verwendet. Sie lassen sich allerdings voneinander abgrenzen. 

Beide Konditionierungen führen dazu, dass eine Verhaltensweise öfter gezeigt wird, wenn sie durch angenehme Konsequenzen verstärkt wird. 

Bei der instrumentellen Konditionierung wird eine bestimmte Verhaltensweise als Mittel (=Instrument) zur Zielerreichung gesehen. Ein Individuum zeigt also ein bestimmtes Verhalten, weil es damit etwas erreichen möchte (Ziel / Intention). Mit dem Verhalten kann es erfolgreich sein und das Ziel erreichen, oder eben nicht. Wenn es Erfolg mit einer Verhaltensweise hatte, dann wird es das Verhalten wiederholen, wenn nicht, dann wird es ein anderes Verhalten versuchen, um das Ziel zu erreichen. Der Erfolg durch das Verhalten wirkt also selbst als Verstärker. 

Eine Person möchte zum Beispiel bewundert (Ziel) werden. Um das zu erreichen, prahlt sie (Verhalten). Wenn sie jetzt die erwünschte Bewunderung erhält (angenehme Konsequenz), dann war ihre Verhaltensweise erfolgreich und sie wiederholt das Verhalten. 

Das Verhalten bei der instrumentellen Konditionierung ist also zielgerichtet. Bei der operanten Konditionierung wird zufällig eine Verhaltensweise gezeigt, die dann von außen belohnt wird. 

Unterschied klassische und operante Konditionierung

Neben der operanten Konditionierung ist auch die klassische Konditionierung eine der wichtigsten Lerntheorien des Behaviorismus. 

Bei der operanten Konditionierung steht das Belohnen bzw. Bestrafen einer erwünschten bzw. unerwünschten Verhaltensweise im Vordergrund.

Die klassische Konditionierung lernt einem Individuum auf ein bestimmtes Signal (=Stimulus) hin, eine bestimmtes Verhalten (=Reaktion) zu zeigen.  

Bei der operanten Konditionierung greifst du also nach einem bestimmten Verhalten ein, bei der klassischen Konditionierung gibst du davor ein Signal für ein bestimmtes Verhalten. 

Du möchtest jetzt noch genauer erfahren, wie du einem Individuum beibringen kannst, auf ein bestimmtes Signal zu reagieren? Schau dir doch jetzt unser Video zur klassischen Konditionierung an! 

Zum Video: Klassische Konditionierung
Zum Video: Klassische Konditionierung

 

Hallo, leider nutzt du einen AdBlocker.

Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.

Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.

Danke!
Dein Studyflix-Team

Wenn du nicht weißt, wie du deinen Adblocker deaktivierst oder Studyflix zu den Ausnahmen hinzufügst, findest du hier eine kurze Anleitung. Bitte lade anschließend die Seite neu.