Operante Konditionierung
Bei der operanten Konditionierung lernt ein Lebewesen eine bestimmte Verhaltensweise häufiger zu zeigen, indem es dafür belohnt wird. Wenn es bestraft wird, verhält es sich seltener so. Du willst die operante Konditionierung noch schneller verstehen? Schau dir doch unser Video zu dem Thema an.
Inhaltsübersicht
Operante Konditionierung einfach erklärt
Die operante Konditionierung ist eine bekannte Lerntheorie des Behaviorismus .
Es geht darum, dass ein Mensch oder ein Tier eine bestimmte Verhaltensweise häufiger oder seltener zeigt, indem du es dafür belohnst oder bestrafst.
Du gehst zum Beispiel für eine ältere Frau einkaufen (Verhaltensweise) und sie bedankt sich danach mit einer Tafel Schokolade (angenehme Konsequenz / Belohnung) bei dir. Dadurch gehst du nächste Woche wieder für sie einkaufen. Wenn du der Frau jetzt aber die Einkäufe bringst und sie beschwert sich, dass du etwas vergessen hast (unangenehme Konsequenz / Bestrafung), dann wirst du wahrscheinlich nichts mehr für sie erledigen.
Hat eine Verhaltensweise also eine angenehme Konsequenz, wird sie öfter gezeigt. Wenn sie eine unangenehme Konsequenz hat, wird sie seltener gezeigt. Das funktioniert auch, wenn durch eine Verhaltensweise eine unangenehmen Konsequenz ausbleibt (Belohnung) oder eine angenehme Konsequenz wegfällt (Bestrafung). Das ist die operante Konditionierung.
Die Definition für operante Konditionierung lautet wie folgt:
Bei der operanten Konditionierung (engl.: operant conditioning) wird Einfluss auf die Auftrittshäufigkeit einer Verhaltensweise genommen. Erwünschte Verhaltensweisen werden durch angenehme Konsequenzen (Positive Verstärkung) bzw. durch das Ausbleiben unangenehmer Konsequenzen (Negative Verstärkung) belohnt. Unerwünschte Verhaltensweisen werden durch unangenehme Konsequenzen (Positive Bestrafung) bzw. durch das Ausbleiben angenehmer Konsequenzen (Negative Bestrafung) unterdrückt.
Verstärker
Bei der operanten Konditionierung gibt es vier Möglichkeiten ein Verhalten zu verstärken bzw. zu bestrafen. Dadurch wird ein Individuum konditioniert, ein Verhalten häufiger bzw. seltener zu zeigen.
Die folgenden Begriffe haben im Zusammenhang mit der operanten Konditionierung diese Bedeutung:
- Positiv = Vorhanden ≠ Angenehm
- Negativ = Abwesend ≠ Unangenehm
- Angenehme Konsequenz = Appetetiv ≠ Positiv
- Unangenehme Konsequenz = Aversiv ≠ Negativ
Im Folgenden betrachten wir die vier möglichen Konsequenzen einer Verhaltensweise genauer.
Verstärkung
Bei einer Verstärkung (engl.: reinforcement) soll ein erwünschtes Verhalten häufiger gezeigt werden. Um das zu erreichen, hast du bei der operanten Konditionierung zwei Möglichkeiten:
-
Positive Verstärkung: Das erwünschte Verhalten belohnst du mit einer angenehmen Konsequenz, indem du dem Individuum zum Beispiel Geld oder Nahrung gibst. Aber auch Achtung und Anerkennung können als positive Verstärker wirken.
- Negative Verstärkung: Du belohnst ein erwünschtes Verhalten, indem die aversiven Konsequenzen ausbleiben, wenn die Verhaltensweise gezeigt wird. Du entfernst zum Beispiel extremen Lärm oder grelles Licht vom Individuum.
Bestrafung
Durch eine Bestrafung (engl.: punishment) möchtest du ein unerwünschtes Verhalten unterdrücken. Auch hier hast du wieder zwei Möglichkeiten:
-
Positive Bestrafung: Du kannst das unerwünschte Verhalten bestrafen, indem dieser Verhaltensweise eine unangenehme Konsequenz folgt. Das Individuum wird zum Beispiel extremen Lärm ausgesetzt oder ein Kind bekommt Hausarrest.
- Negative Bestrafung: Das unerwünschte Verhalten kannst du auch unterdrücken, indem eine angenehme Konsequenz auf das Verhalten hin ausbleibt. Du kannst dem Individuum zum Beispiel Nahrung wegnehmen oder es nicht mehr begrüßen.
Kontingenzschema
Darstellen kannst du die vier möglichen Konsequenzen der operanten Konditionierung anhand eines sogenannten Kontingenzschemas. Hier sind die angenehmen und die unangenehmen Konsequenzen, ihr Hinzufügen oder ihr Entfernen und die Wirkung dargestellt. Das sieht dann so aus:
Ursprung der klassischen Konditionierung: Law of effect
Die Idee der operanten Konditionierung geht auf das Gesetz der Wirkung (engl.: law of effect) von Edward Lee Thorndike zurück. Es beschreibt, dass bei zufällig auftretenden Handlungen, die Handlungen häufiger gezeigt werden, die positive Folgen haben.
Beispiel: Skinnerbox (Burrhus Frederic Skinner)
Das Law of effect hat Burrhus Frederic Skinner aufgegriffen und daraus die operante Konditionierung entwickelt. Dazu hat er die sogenannte Skinnerbox entworfen.
Die Skinnerbox ist ein Käfig, worin sich später eine Ratte befindet. Im Käfig ist ein Hebel angebracht, den die Ratte drücken kann. Außerdem gibt es eine Vorrichtung für Futter, eine Lampe und einen Boden, der unter Strom gesetzt werden kann.
Jetzt hat Skinner verschiedene Experimente durchgeführt. Diese schauen wir uns genauer an:
-
Positive Verstärkung: Die Ratte bekommt immer, wenn sie den Hebel betätigt (Verhalten), Futter (Angenehme Konsequenz). Dadurch zeigt sie das Verhalten häufiger.
-
Negative Verstärkung: Der Käfigboden der Ratte steht ständig unter Strom. Wenn die Ratte jetzt den Hebel drückt (Verhalten), geht der Strom aus (unangenehme Konsequenz bleibt aus). Sie verhält sich öfter so.
-
Positive Bestrafung: Die Ratte bekommt immer einen Stromschlag (Unangenehme Konsequenz), wenn sie den Hebel (Verhalten) drückt. Das führt dazu, dass sie das Verhalten seltener zeigt.
- Negative Bestrafung: Die vierte Möglichkeit hat Skinner nicht durchgeführt, dabei würde die Ratte immer dann kein Futter erhalten (angenehme Konsequenz bleibt aus), wenn sie den Hebel drückt (Verhalten). Sie vermeidet daraufhin das Verhalten.
Im nächsten Schritt hat er einer Ratte jetzt noch beigebracht, dass sie nur dann Futter bekommt (Angenehme Konsequenz), wenn sie den Hebel drückt (Verhalten) während die Lampe im Käfig leuchtet (Stimulus). Du kannst also ein Verhalten also auch an eine bestimmte Bedingung oder Situation knüpfen.
Die Skinnerbox ist ein wichtiges Beispiel für das operante Konditionieren, schauen wir uns jetzt an, was du im Allgemeinen zu den Verstärkern bei der operanten Konditionierung wissen solltest.
Zeitliches Auftreten der Verstärker
Grundsätzlich können Verstärker unterschiedlich oft auftreten. Häufig wird ein Verstärkerplan verwendet. Dabei kannst du die folgenden Methoden unterscheiden.
1. Kontinuierliche Verstärker/Immer-Verstärker:
Jedes Mal, wenn das erwünschte Verhalten auftritt, belohnst du es. Bei dieser Art der Verstärkung lernt das Individuum zwar schnell und zeigt das Verhalten häufig. Es verlernt es allerdings auch genauso schnell wieder.
Beispiel: Du wirst für jeden Handgriff im Haushalt gelobt.
2. Intermittierende Verstärkung/Manchmal-Verstärkung/Partielle Verstärkung:
Hier wird das Verhalten nur hin und wieder verstärkt. Dadurch dauert das operante Lernen zwar länger, aber es ist auch nachhaltiger. Das erwünschte Verhalten wird als längerfristig häufiger gezeigt.
Beispiel: Du sagst einer Köchin, dass das Essen heute besonders gut geschmeckt hat.
Die intermittierende Verstärkung kannst du nochmal gliedern in:
-
Quotenverstärkung: Es wird zum Beispiel jedes 10. Mal das erwünschte Verhalten verstärkt.
- Intervallverstärkung: Es wird zum Beispiel pro Stunde drei Mal verstärkt, wenn du das Individuum also in den ersten zehn Minuten drei Mal lobst, dann darfst du es die restlichen 50 Minuten nicht mehr loben.
Arten von Verstärkern
Als Verstärker können verschiedene Gegenstände und Handlungen dienen. Du kannst bei der operanten Konditionierung nochmal wie folgt unterscheiden:
-
Primäre Verstärker: Sie befriedigen physiologische Bedürfnisse, wie Nahrung oder Trinken.
-
Sekundäre Verstärker: Sie sind nicht lebensnotwendig. Du hast bereits gelernt, dass sie erstrebenswert sind wie Lob, gute Noten, die Erlaubnis oder Befugnis für etwas.
-
Materielle Verstärker: Dazu zählst du alle Gegenstände, die mit materiellem Aufwand verbunden sind wie Blumen und Schokolade, aber auch Geld und Gehalt.
-
Handlungsverstärker: Du belohnst mit einer angenehmen Tätigkeit, wie einem Kinobesuch oder mit andere Freizeitaktivitäten.
- Soziale Verstärker: Belohnung durch angenehmen zwischenmenschlichen Kontakt, wie Lob, Beifall, Anlächeln oder Anerkennung.
Ein Verstärker kann gleichzeitig zu mehreren Kategorien gehören. So ist Lob beispielsweise gleichzeitig ein sekundärer und ein sozialer Verstärker.
Wirksamkeit der Verstärker
Die einzelnen möglichen Verstärker sind unterschiedlich wirksam. Das heißt, dass ein Individuum die Verhaltensweise durch einen bestimmten Verstärker schneller lernt als durch einen anderen Verstärker. Die Wirksamkeit des Verstärkers der operanten Konditionierung ist von Folgendem abhängig:
-
Person (Bsp. ein Schoko-Liebhaber freut sich über eine Tafel Schokolade stärker als jemand, der keine Süßigkeiten mag)
-
Situation (Bsp. Wenn du gerade schon eine Tafel Schokolade als Belohnung bekommen hast, freust du dich über eine zweite deutlich weniger)
-
Kultur und Sozialisation
(Bsp. Prestige und Reichtum ist zum Beispiel in den unterschiedlichen Kulturen und in den unterschiedlichen sozialen Schichten unterschiedlich angesehen)
-
Lobende Person (Bsp. Du freust dich mehr, wenn du von deinem Trainer gelobt wirst als wenn dich jemand lobt, der weniger Erfahrung hat)
- Zeit (Bsp. Wenn du eine Tafel Schokolade für eine bestimmte Verhaltensweise bekommst, bringt es mehr, wenn du sie unmittelbar nach den Verhalten bekommst, als wenn sie dir ein Jahr später überreicht wird)
Lernen durch Bestrafung
Wenn du möchtest, dass unerwünschtes Verhalten seltener oder gar nicht auftritt, dann bestrafst du es bei der operanten Konditionierung. Dadurch verstärkst du aber nicht das erwünschte Verhalten, sondern schwächst nur das unerwünschte Verhalten ab. Diese Verhaltensweise wird also kurzfristig nicht mehr gezeigt und unterdrückt. Langfristig tritt sie aber wahrscheinlich wieder auf.
Extinktion und spontane Erholung
Wenn eine Verhaltensweise einmal gelernt ist, bleibt die Belohnung häufig aus. Das führt aber zur Extinktion (=Löschung) der Verhaltensweise. Das heißt also, dass du die erlernte Verhaltensweise wieder „verlernst„. Das erwünschte Verhalten wird dadurch seltener gezeigt, wenn es nicht mehr belohnt wird.
Es kann aber auch sein, dass die Verhaltensweise ohne Verstärkung erst mal übermäßig auftritt, weil die angenehmen Konsequenzen so ungeduldig eingefordert werden. Nach einiger Zeit legt sich aber auch das und die Verhaltensweise wird nicht mehr absichtlich gezeigt.
Eine andere Möglichkeit, wie ein Individuum das ausbleiben eines Verstärkers auffassen kann, ist, dass es als Bestrafung interpretiert wird. Dadurch wird das Verhalten noch schneller „verlernt“.
Unabhängig davon, wie die Extinktion verläuft, tritt häufig dieses Phänomen auf: Das Verhalten wird nach einiger Zeit einfach trotzdem spontan und grundlos wieder gezeigt, ohne dass es nochmal verstärkt wurde. Nimmt dann aber auch wieder ab. Das nennst du spontane Erholung.
Shaping
Die operante Konditionierung wird beim sogenannten Shaping angewandt. Darunter verstehst du die stufenweise Annäherung an eine erwünschte komplexere Verhaltensweise. Die Methode wird häufig bei der Dressur von Tieren verwendet.
Du möchtest zum Beispiel deinem Pferd durch Shaping beibringen, dass es über eine größere Entfernung zu dir kommt, wenn du es rufst. Dazu stellst du dich als erstes nur einen Meter vom Pferd weg und rufst es. Wenn es kommt, lobst du es. Das führst du ein paar Mal so durch, bis es immer zu dir geht. Als nächstes entfernst du dich etwas weiter und machst das gleiche. Mit der Zeit vergrößerst du dann Schritt für Schritt den Abstand. Du lobst das Pferd jetzt nur noch, wenn es mit großem Abstand zu dir kommt.
Abgrenzung instrumentelle Konditionierung
Die instrumentelle Konditionierung wird oft mit der operanten Konditionierung gleichgesetzt und die Begriffe werden synonym verwendet. Sie lassen sich allerdings voneinander abgrenzen.
Beide Konditionierungen führen dazu, dass eine Verhaltensweise öfter gezeigt wird, wenn sie durch angenehme Konsequenzen verstärkt wird.
Bei der instrumentellen Konditionierung wird eine bestimmte Verhaltensweise als Mittel (=Instrument) zur Zielerreichung gesehen. Ein Individuum zeigt also ein bestimmtes Verhalten, weil es damit etwas erreichen möchte (Ziel/Intention). Mit dem Verhalten kann es erfolgreich sein und das Ziel erreichen, oder eben nicht. Wenn es Erfolg mit einer Verhaltensweise hatte, dann wird es das Verhalten wiederholen, wenn nicht, dann wird es ein anderes Verhalten versuchen, um das Ziel zu erreichen. Der Erfolg durch das Verhalten wirkt also selbst als Verstärker.
Eine Person möchte zum Beispiel bewundert werden (Ziel). Um das zu erreichen, prahlt sie (Verhalten). Wenn sie jetzt die erwünschte Bewunderung erhält (angenehme Konsequenz), dann war ihre Verhaltensweise erfolgreich und sie wiederholt das Verhalten.
Das Verhalten bei der instrumentellen Konditionierung ist also zielgerichtet. Bei der operanten Konditionierung wird zufällig eine Verhaltensweise gezeigt, die dann von außen belohnt wird.
Unterschied klassische und operante Konditionierung
Neben der operanten Konditionierung ist auch die klassische Konditionierung eine der wichtigsten Lerntheorien des Behaviorismus.
Bei der operanten Konditionierung steht das Belohnen bzw. Bestrafen einer erwünschten bzw. unerwünschten Verhaltensweise im Vordergrund.
Die klassische Konditionierung lernt einem Individuum auf ein bestimmtes Signal (=Stimulus) hin, eine bestimmtes Verhalten (=Reaktion) zu zeigen.
Bei der operanten Konditionierung greifst du also nach einem bestimmten Verhalten ein, bei der klassischen Konditionierung gibst du davor ein Signal für ein bestimmtes Verhalten.
Du möchtest jetzt noch genauer erfahren, wie du einem Individuum beibringen kannst, auf ein bestimmtes Signal zu reagieren? Schau dir doch jetzt unser Video zur klassischen Konditionierung an!