Operante Konditionierung
Du möchtest wissen, was genau operante Konditionierung ist und wie sie funktioniert? Hier erfährst du alles Wichtige, von den Grundlagen bis hin zu anschaulichen Beispielen!
Inhaltsübersicht
Operante Konditionierung einfach erklärt
Die operante Konditionierung ist eine bekannte Lerntheorie des Behaviorismus. Es geht darum, dass ein Mensch oder ein Tier eine bestimmte Verhaltensweise häufiger oder seltener zeigt, indem du es dafür belohnst oder bestrafst.
Du gehst zum Beispiel für eine ältere Frau einkaufen (Verhaltensweise) und sie bedankt sich danach mit einer Tafel Schokolade (angenehme Konsequenz / Belohnung) bei dir. Dadurch gehst du nächste Woche wieder für sie einkaufen. Wenn du der Frau jetzt aber die Einkäufe bringst und sie beschwert sich, dass du etwas vergessen hast (unangenehme Konsequenz / Bestrafung), dann wirst du wahrscheinlich nichts mehr für sie erledigen.
Hat eine Verhaltensweise also eine angenehme Konsequenz, wird sie öfter gezeigt. Wenn sie aber eine unangenehme Konsequenz hat, wird sie seltener gezeigt. Das funktioniert auch, wenn durch eine Verhaltensweise eine unangenehme Konsequenz ausbleibt (Belohnung) oder eine angenehme Konsequenz wegfällt (Bestrafung). Das ist die operante Konditionierung.
Bei der operanten Konditionierung (engl.: operant conditioning) wird Einfluss auf die Auftrittshäufigkeit einer Verhaltensweise genommen. Erwünschte Verhaltensweisen werden durch angenehme Konsequenzen (Positive Verstärkung) bzw. durch das Ausbleiben unangenehmer Konsequenzen (Negative Verstärkung) belohnt. Unerwünschte Verhaltensweisen werden durch unangenehme Konsequenzen (Positive Bestrafung) bzw. durch das Ausbleiben angenehmer Konsequenzen (Negative Bestrafung) unterdrückt.
Verstärker
Bei der operanten Konditionierung gibt es vier Möglichkeiten ein Verhalten zu verstärken bzw. zu bestrafen. Dadurch wird ein Individuum konditioniert, ein Verhalten häufiger bzw. seltener zu zeigen.
Die folgenden Begriffe haben im Zusammenhang mit der operanten Konditionierung diese Bedeutung:
- Positiv = etwas ist vorhanden / wird gegeben
- Negativ = etwas ist abwesend / wird genommen
Im Folgenden betrachten wir die vier möglichen Konsequenzen einer Verhaltensweise genauer.
Verstärkung
Bei einer Verstärkung (engl.: reinforcement) soll ein erwünschtes Verhalten häufiger gezeigt werden. Um das zu erreichen, hast du bei der operanten Konditionierung zwei Möglichkeiten:
- Positive Verstärkung: Das erwünschte Verhalten belohnst du mit einer angenehmen Konsequenz, indem du dem Individuum zum Beispiel Geld oder Nahrung gibst. Aber auch Achtung und Anerkennung können als positive Verstärker wirken.
- Negative Verstärkung: Du belohnst ein erwünschtes Verhalten, indem die unangenehmen Konsequenzen ausbleiben, wenn die Verhaltensweise gezeigt wird. Du entfernst zum Beispiel extremen Lärm oder grelles Licht vom Individuum.
Bestrafung
Durch eine Bestrafung (engl.: punishment) möchtest du ein unerwünschtes Verhalten unterdrücken. Auch hier hast du wieder zwei Möglichkeiten:
- Positive Bestrafung: Du kannst das unerwünschte Verhalten bestrafen, indem dieser Verhaltensweise eine unangenehme Konsequenz folgt. Das Individuum wird zum Beispiel extremen Lärm ausgesetzt oder ein Kind bekommt Hausarrest.
- Negative Bestrafung: Das unerwünschte Verhalten kannst du auch unterdrücken, indem eine angenehme Konsequenz auf das Verhalten hin ausbleibt. Du kannst dem Individuum zum Beispiel Nahrung wegnehmen oder es nicht mehr begrüßen.
Kontingenzschema
Darstellen kannst du die vier möglichen Konsequenzen der operanten Konditionierung anhand eines sogenannten Kontingenzschemas. Hier sind die angenehmen und die unangenehmen Konsequenzen, ihr Hinzufügen oder ihr Entfernen und die Wirkung dargestellt. Das sieht dann so aus:
Schon gewusst: Du sprichst hier vom Kontingenzschema, da in der Psychologie die Beziehung zwischen Verhalten und der daraus entstehenden Konsequenz als Kontingenz bezeichnet wird.
Operante Konditionierung Skinnerbox (Burrhus Frederic Skinner)
Burrhus Frederic Skinner ist der Entwickler der operanten Konditionierung. Dafür hat er die sogenannte Skinnerbox entworfen.
Die Skinnerbox ist ein Käfig, worin sich später eine Ratte befindet. Im Käfig ist ein Hebel angebracht, den die Ratte drücken kann. Außerdem gibt es eine Vorrichtung für Futter, eine Lampe und einen Boden, der unter Strom gesetzt werden kann.
Jetzt hat Skinner verschiedene Experimente durchgeführt. Diese schauen wir uns genauer an:
- Positive Verstärkung: Die Ratte bekommt immer, wenn sie den Hebel betätigt (Verhalten), Futter (Angenehme Konsequenz). Dadurch zeigt sie das Verhalten häufiger.
- Negative Verstärkung: Der Käfigboden der Ratte steht ständig unter Strom. Wenn die Ratte jetzt den Hebel drückt (Verhalten), geht der Strom aus (unangenehme Konsequenz bleibt aus). Sie verhält sich öfter so.
- Positive Bestrafung: Die Ratte bekommt immer einen Stromschlag (Unangenehme Konsequenz), wenn sie den Hebel (Verhalten) drückt. Das führt dazu, dass sie das Verhalten seltener zeigt.
- Negative Bestrafung: Die vierte Möglichkeit hat Skinner nicht durchgeführt, dabei würde die Ratte immer dann kein Futter erhalten (angenehme Konsequenz bleibt aus), wenn sie den Hebel drückt (Verhalten). Sie vermeidet daraufhin das Verhalten.
Im nächsten Schritt hat er einer Ratte jetzt noch beigebracht, dass sie nur dann Futter bekommt (Angenehme Konsequenz), wenn sie den Hebel drückt (Verhalten) während die Lampe im Käfig leuchtet (Stimulus). Du kannst also ein Verhalten also auch an eine bestimmte Bedingung oder Situation knüpfen.
Die Skinnerbox ist ein wichtiges Beispiel für das operante Konditionieren, schauen wir uns jetzt an, was du im Allgemeinen zu den Verstärkern bei der operanten Konditionierung wissen solltest.
Operante Konditionierung — Beispiele
Um die verschiedenen Formen der operanten Konditionierung besser zu verstehen, schauen wir uns einige typische Beispiele an.
1. Beispiel für positive Verstärkung
Bei der positiven Verstärkung wird ein Verhalten durch das Hinzufügen eines angenehmen Reizes gefördert.
- Beispiel: Ein Schüler lernt fleißig für seine Mathearbeit und erhält dafür eine gute Note und ein Lob vom Lehrer. Durch diese Belohnung lernt der Schüler, dass sich Anstrengung beim Lernen auszahlt. Dadurch wird er motiviert, auch in Zukunft für Prüfungen zu lernen.
2. Beispiel für negative Verstärkung
Negative Verstärkung bedeutet, dass ein unangenehmer Reiz entfernt wird, um ein Verhalten zu fördern.
- Beispiel: Für das regelmäßige Zuspätkommen zur Arbeit bekommt ein Mitarbeiter kritische Blicke und Ermahnungen vom Vorgesetzten. Als er beginnt, pünktlich zu erscheinen, bleiben die Ermahnungen aus. Durch das Ausbleiben der negativen Rückmeldungen wird der Mitarbeiter ermutigt, weiterhin pünktlich zu kommen.
3. Beispiel für positive Bestrafung
Positive Bestrafung meint das Hinzufügen eines unangenehmen Reizes, um ein Verhalten zu reduzieren.
- Beispiel: Wenn ein Kind seine Hausaufgaben für die Schule nicht macht, wird es ermahnt. Die Ermahnung vor der gesamten Klasse ist für das Kind unangenehm, wodurch sich die Wahrscheinlichkeit verringert, dass das Kind erneut seine Hausaufgaben vernachlässigt.
4. Beispiel für negative Bestrafung
Bei der negativen Bestrafung wird ein angenehmer Reiz entfernt, um ein unerwünschtes Verhalten zu verringern.
- Beispiel: Ein Teenager bleibt trotz Verbots lange draußen und bekommt deshalb eine Woche lang kein Taschengeld. Durch das Entziehen des Taschengelds wird ihm ein angenehmer Reiz vorenthalten. Dadurch wird das unerwünschte Verhalten — zu spät nach Hause kommen — weniger attraktiv.
Zeitliches Auftreten der Verstärker
Grundsätzlich können Verstärker unterschiedlich oft auftreten. Häufig wird ein Verstärkerplan verwendet. Dabei kannst du die Methoden kontinuierlicher Verstärker, intermittierende Verstärkung und Shaping unterscheiden.
Kontinuierliche Verstärker/Immer-Verstärker
Jedes Mal, wenn das erwünschte Verhalten auftritt, belohnst du es. Bei dieser Art der Verstärkung lernt das Individuum zwar schnell und zeigt das Verhalten häufig. Es verlernt es allerdings auch genauso schnell wieder.
Beispiel: Dein Lehrer lobt dich jedes Mal, wenn du eine richtige Antwort gibst. Da du für jede richtige Antwort unmittelbar positive Rückmeldung erhältst, lernst du schnell, dich aktiv am Unterricht zu beteiligen.
Intermittierende Verstärkung/Manchmal-Verstärkung/Partielle Verstärkung
Hier wird das Verhalten nur hin und wieder verstärkt. Dadurch dauert das operante Lernen zwar länger, aber es ist auch nachhaltiger. Das erwünschte Verhalten wird also längerfristig häufiger gezeigt.
Beispiel: Du gibst deinem Hund gelegentlich ein Leckerli, wenn der Hund auf Befehl sitzt. Da der Hund nicht jedes Mal eine Belohnung erhält, wird er das Verhalten auch dann weiterhin zeigen, wenn das Leckerli ausbleibt. Dies ist besonders nützlich, wenn ein Verhalten auch ohne konstante Belohnung zuverlässig abgerufen werden soll.
Die intermittierende Verstärkung kannst du nochmal gliedern in:
- Quotenverstärkung: Es wird zum Beispiel jedes 10. Mal das erwünschte Verhalten verstärkt.
- Intervallverstärkung: Es wird zum Beispiel pro Stunde dreimal verstärkt, wenn du das Individuum also in den ersten zehn Minuten dreimal lobst, dann darfst du es die restlichen 50 Minuten nicht mehr loben.
Shaping
Shaping (dt. Verhaltensformung) ist eine spezielle Methode, bei der komplexes Verhalten schrittweise aufgebaut wird. Dafür wird jede Annäherung an das gewünschte Endverhalten belohnt. So kann durch Shaping Verhalten in kleinen Schritten erlernt werden. Das ist insbesondere nützlich, wenn das Endverhalten aus mehreren Teilhandlungen besteht.
-
Beispiel: Dein Hund soll lernen, eine Rolle zu machen. Zunächst belohnst du ihn, wenn er sich seitlich hinlegt. Im nächsten Schritt belohnst du nur das Verhalten, bei dem er sich weiterdreht. Schließlich erhält er eine Belohnung, wenn er die Rolle vollständig ausführt. Dadurch lernt dein Hund schrittweise die gesamte Bewegung.
Shaping ist besonders in der Verhaltenspsychologie und im Training hilfreich. Vor allem dann, wenn Verhalten entwickelt werden soll, das nicht spontan auftritt oder aus vielen Einzelschritten besteht. Denn durch die stufenweise Annäherung wird das Verhalten aufgebaut, ohne den Lernenden zu überfordern.
Arten von Verstärkern
Als Verstärker können verschiedene Gegenstände und Handlungen dienen. Du kannst bei der operanten Konditionierung nochmal wie folgt unterscheiden:
- Primäre Verstärker: Sie befriedigen physiologische Bedürfnisse, wie Nahrung oder Trinken.
- Sekundäre Verstärker: Sie sind nicht lebensnotwendig. Du hast bereits gelernt, dass sie erstrebenswert sind wie Lob, gute Noten, die Erlaubnis oder Befugnis für etwas.
- Materielle Verstärker: Dazu zählst du alle Gegenstände, die mit materiellem Aufwand verbunden sind wie Blumen und Schokolade, aber auch Geld und Gehalt.
- Handlungsverstärker: Du belohnst mit einer angenehmen Tätigkeit, wie einem Kinobesuch oder mit anderen Freizeitaktivitäten.
- Soziale Verstärker: Belohnung durch angenehmen zwischenmenschlichen Kontakt, wie Lob, Beifall, Anlächeln oder Anerkennung.
Ein Verstärker kann gleichzeitig zu mehreren Kategorien gehören. So ist Lob beispielsweise gleichzeitig ein sekundärer und ein sozialer Verstärker.
Wirksamkeit der Verstärker
Die einzelnen möglichen Verstärker sind unterschiedlich wirksam. Das heißt, dass ein Individuum die Verhaltensweise durch einen bestimmten Verstärker schneller lernt als durch einen anderen Verstärker. Die Wirksamkeit des Verstärkers der operanten Konditionierung ist von Folgendem abhängig:
- Person (Bsp. ein Schoko-Liebhaber freut sich über eine Tafel Schokolade stärker als jemand, der keine Süßigkeiten mag)
- Situation (Bsp. Wenn du gerade schon eine Tafel Schokolade als Belohnung bekommen hast, freust du dich über eine zweite deutlich weniger)
- Kultur und Sozialisation (Bsp. Prestige und Reichtum ist zum Beispiel in den unterschiedlichen Kulturen und in den unterschiedlichen sozialen Schichten unterschiedlich angesehen)
- Lobende Person (Bsp. Du freust dich mehr, wenn du von deinem Trainer gelobt wirst, als wenn dich jemand lobt, der weniger Erfahrung hat)
- Zeit (Bsp. Wenn du eine Tafel Schokolade für eine bestimmte Verhaltensweise bekommst, bringt es mehr, wenn du sie unmittelbar nach den Verhalten bekommst, als wenn sie dir ein Jahr später überreicht wird)
Extinktion und spontane Erholung
Wenn eine Verhaltensweise einmal gelernt ist, bleibt die Belohnung häufig aus. Das führt aber zur Extinktion (=Löschung) der Verhaltensweise. Das heißt also, dass du die erlernte Verhaltensweise wieder „verlernst“. Das erwünschte Verhalten wird dadurch seltener gezeigt, wenn es nicht mehr belohnt wird.
Es kann aber auch sein, dass die Verhaltensweise ohne Verstärkung erst mal übermäßig auftritt, weil die angenehmen Konsequenzen so ungeduldig eingefordert werden. Nach einiger Zeit legt sich aber auch das und die Verhaltensweise wird nicht mehr absichtlich gezeigt.
Eine andere Möglichkeit, wie ein Individuum das Ausbleiben eines Verstärkers auffassen kann, ist, dass es als Bestrafung interpretiert wird. Dadurch wird das Verhalten noch schneller „verlernt“.
Unabhängig davon, wie die Extinktion verläuft, tritt häufig dieses Phänomen auf: Das Verhalten wird nach einiger Zeit einfach trotzdem spontan und grundlos wieder gezeigt, ohne dass es nochmal verstärkt wurde. Nimmt dann aber auch wieder ab. Das nennst du spontane Erholung.
Unterschied klassische und operante Konditionierung
Klassische und operante Konditionierung sind zwei verschiedene Lernmethoden, um das Verhalten zu beeinflussen. Sie unterscheiden sich aber anhand eines wichtigen Punktes: Die klassische Konditionierung hat das Ziel, dass jemand automatisch auf einen bestimmten Reiz reagiert. Die operante Konditionierung hingegen möchte durch Belohnung oder Bestrafung ein aktives Verhalten hervorrufen.
klassische Operationalisierung | operante Konditionierung |
Das Verhalten passiert automatisch als Reaktion auf einen bestimmten Reiz, ohne etwas dafür zu tun. | Das Verhalten wird bewusst gezeigt, da etwas Bestimmtes erreicht werden will, z. B. eine Belohnung. |
Beispiel: Wenn ein Hund das Geräusch einer Futterdose hört, beginnt er zu speicheln, weil er das Geräusch mit Futter verbindet. Das Speicheln passiert dabei automatisch. | Beispiel: Ein Hund lernt, sich auf Kommando hinzusetzen, weil er dafür ein Leckerli bekommt. Der Hund setzt sich aktiv hin, weil er eine Belohnung (das Leckerli) erwartet. |
Verwendung: um Gewohnheiten oder Reflexe zu beeinflussen | Verwendung: um Verhalten gezielt zu fördern |
Operante Konditionierung — häufigste Fragen
-
Was ist die operante Konditionierung nach Skinner? Die operante Konditionierung ist eine Theori von Skinner. Sie besagt, dass Lebewesen ein Verhalten wiederholen, wenn sie dafür belohnt werden und es künftig vermeiden, wenn sie dafür bestraft werden. -
Was ist positive und negative Verstärkung? Bei der positiven Verstärkung soll eine Verhaltensweise durch eine Belohnung (z. B. Futter) verstärkt werden. Bei der negativen Verstärkung, soll eine Verhaltensweise antrainiert werden, indem ein unangenehmer Zustand (z. B. lautes Dauergeräusch) weggenommen bzw. verringert wird. -
Was ist eine positive Bestrafung? Bei einer positiven Bestrafung wird ein Individuum bestraft (z. B. ermahnen), um eine bestimmte Verhaltensweise abzutrainieren. Das kann auch durch eine negative Bestrafung erfolgen, bei der ein angenehmer Zustand (z. B. Taschengeld) entfernt wird. -
Was ist der Unterschied zwischen der klassischen und der operanten Konditionierung?
Der Unterschied zwischen der klassischen und operanten Konditionierung ist: Bei der klassischen Konditionierung wird eine automatische Reaktion hervorgerufen, während die operante Konditionierung ein freiwilliges und bewusstes Verhalten trainiert.
Klassische Konditionierung
Jetzt weißt du alles über die operante Konditionierung. Wenn du auch noch mehr über die klassische Konditionierung wissen möchtest, schau hier in unserem Video vorbei!