Was ist die operante Konditionierung nach Skinner?

Operante Konditionierung nach Skinner bedeutet, dass die Häufigkeit eines Verhaltens über seine Konsequenzen gesteuert wird. Führt ein Verhalten zu einer Belohnung, wird es wahrscheinlicher. Führt es zu einer Bestrafung oder fällt eine Belohnung weg, wird es unwahrscheinlicher.

Welche Beispiele für operante Konditionierung gibt es im Alltag?

Beispiele für operante Konditionierung im Alltag sind Situationen, in denen Konsequenzen dein Verhalten verändern. Zum Beispiel lernst du häufiger, wenn du für gute Mitarbeit Lob bekommst. Du kommst eher pünktlich, wenn sonst eine unangenehme Ermahnung folgt. Du räumst seltener auf, wenn danach kein Taschengeld kommt.

Welche Beispiele gibt es für operante Konditionierung bei Hunden?

Beispiele für operante Konditionierung bei Hunden sind Trainingssituationen, in denen der Hund für sein Verhalten eine Konsequenz erlebt. Zum Beispiel bekommt der Hund ein Leckerli, wenn er sich auf Kommando hinsetzt, und setzt sich dann häufiger. Bleibt das Leckerli aus, wird das Verhalten seltener.

Was ist der Unterschied zwischen negativer Verstärkung und negativer Bestrafung?

Negative Verstärkung bedeutet, dass ein unangenehmer Reiz wegfällt und du ein Verhalten deshalb häufiger zeigst. Negative Bestrafung bedeutet, dass ein angenehmer Reiz wegfällt und du ein Verhalten deshalb seltener zeigst. Zum Beispiel: Lärm hört auf, wenn du handelst, versus Handy wird weggenommen.

Video

Zurück zum Text

Weiter lernen Empfohlenes passendes Video

Operante Konditionierung

Wichtige Inhalte in diesem Video

Was ist Operante Konditionierung? — einfach erklärt

(00:14)

Was sind positive und negative Verstärker — und wie wirken sie?

(00:49)

So entstand die Theorie der operanten Konditionierung — Skinnerbox (Burrhus Frederic Skinner)

(02:49)

Du möchtest wissen, was genau operante Konditionierung ist und wie sie funktioniert? Hier erfährst du alles Wichtige, von den Grundlagen bis hin zu anschaulichen Beispielen!

Inhaltsübersicht

Was ist Operante Konditionierung? — einfach erklärt

im Videozur Stelle im Video springen

(00:14)

Die operante Konditionierung ist eine bekannte Lerntheorie des Behaviorismus. Es geht darum, dass ein Mensch oder ein Tier eine bestimmte Verhaltensweise häufiger oder seltener zeigt, indem du es dafür belohnst oder bestrafst.

Du gehst zum Beispiel für eine ältere Frau einkaufen (Verhaltensweise) und sie bedankt sich danach mit einer Tafel Schokolade (angenehme Konsequenz / Belohnung) bei dir. Dadurch gehst du nächste Woche wieder für sie einkaufen. Wenn du der Frau jetzt aber die Einkäufe bringst und sie beschwert sich, dass du etwas vergessen hast (unangenehme Konsequenz / Bestrafung), dann wirst du wahrscheinlich nichts mehr für sie erledigen.

Angenehme Konsequenzen, unangenehme Konsequenzen, Skinner, Konditionieren, operant, Lerntheorie — Operante Konditionierung

Hat eine Verhaltensweise also eine angenehme Konsequenz, wird sie öfter gezeigt. Wenn sie aber eine unangenehme Konsequenz hat, wird sie seltener gezeigt. Das funktioniert auch, wenn durch eine Verhaltensweise eine unangenehme Konsequenz ausbleibt (Belohnung) oder eine angenehme Konsequenz wegfällt (Bestrafung). Das ist die operante Konditionierung.

Operante Konditionierung — Definition

Bei der operanten Konditionierung (engl.: operant conditioning) wird Einfluss auf die Auftrittshäufigkeit einer Verhaltensweise genommen. Erwünschte Verhaltensweisen werden durch angenehme Konsequenzen (Positive Verstärkung) bzw. durch das Ausbleiben unangenehmer Konsequenzen (Negative Verstärkung) belohnt. Unerwünschte Verhaltensweisen werden durch unangenehme Konsequenzen (Positive Bestrafung) bzw. durch das Ausbleiben angenehmer Konsequenzen (Negative Bestrafung) unterdrückt.

Was sind positive und negative Verstärker — und wie wirken sie?

im Videozur Stelle im Video springen

(00:49)

Bei der operanten Konditionierung gibt es vier Möglichkeiten ein Verhalten zu verstärken bzw. zu bestrafen. Dadurch wird ein Individuum konditioniert, ein Verhalten häufiger bzw. seltener zu zeigen.

Hinweis

Die folgenden Begriffe haben im Zusammenhang mit der operanten Konditionierung diese Bedeutung:

Positiv = etwas ist vorhanden / wird gegeben
Negativ = etwas ist abwesend / wird genommen

Im Folgenden betrachten wir die vier möglichen Konsequenzen einer Verhaltensweise genauer.

Studyflix vernetzt: Hier ein Video aus einem anderen Bereich

Nach Beantwortung speichern wir deine Antwort, um Studyflix zu verbessern. Mehr dazu erfährst du in unserer Datenschutzerklärung.

Verstärkung

Bei einer Verstärkung (engl.: reinforcement) soll ein erwünschtes Verhalten häufiger gezeigt werden. Um das zu erreichen, hast du bei der operanten Konditionierung zwei Möglichkeiten:

Positive Verstärkung: Das erwünschte Verhalten belohnst du mit einer angenehmen Konsequenz, indem du dem Individuum zum Beispiel Geld oder Nahrung gibst. Aber auch Achtung und Anerkennung können als positive Verstärker wirken.
Negative Verstärkung: Du belohnst ein erwünschtes Verhalten, indem die unangenehmen Konsequenzen ausbleiben, wenn die Verhaltensweise gezeigt wird. Du entfernst zum Beispiel extremen Lärm oder grelles Licht vom Individuum.

Bestrafung

Durch eine Bestrafung (engl.: punishment) möchtest du ein unerwünschtes Verhalten unterdrücken. Auch hier hast du wieder zwei Möglichkeiten:

Positive Bestrafung: Du kannst das unerwünschte Verhalten bestrafen, indem dieser Verhaltensweise eine unangenehme Konsequenz folgt. Das Individuum wird zum Beispiel extremen Lärm ausgesetzt oder ein Kind bekommt Hausarrest.
Negative Bestrafung: Das unerwünschte Verhalten kannst du auch unterdrücken, indem eine angenehme Konsequenz auf das Verhalten hin ausbleibt. Du kannst dem Individuum zum Beispiel Nahrung wegnehmen oder es nicht mehr begrüßen.

Kontingenzschema

Darstellen kannst du die vier möglichen Konsequenzen der operanten Konditionierung anhand eines sogenannten Kontingenzschemas. Hier sind die angenehmen und die unangenehmen Konsequenzen, ihr Hinzufügen oder ihr Entfernen und die Wirkung dargestellt. Das sieht dann so aus:

Operante Konditionierung, Angenehme Konsequenz, Unangenehme Konsequenz, Positive Verstärkung, Negative Verstärkung, Negative Bestrafung, Positive Bestrafung — Kontingenzschema der operanten Konditionierung

Schon gewusst: Du sprichst hier vom Kontingenzschema, da in der Psychologie die Beziehung zwischen Verhalten und der daraus entstehenden Konsequenz als Kontingenz bezeichnet wird.

So entstand die Theorie der operanten Konditionierung — Skinnerbox (Burrhus Frederic Skinner)

im Videozur Stelle im Video springen

(02:49)

Burrhus Frederic Skinner ist der Entwickler der operanten Konditionierung. Dafür hat er die sogenannte Skinnerbox entworfen.

Die Skinnerbox ist ein Käfig, worin sich später eine Ratte befindet. Im Käfig ist ein Hebel angebracht, den die Ratte drücken kann. Außerdem gibt es eine Vorrichtung für Futter, eine Lampe und einen Boden, der unter Strom gesetzt werden kann.

Brrrhus Frederic Skinner, Operante Konditionierung, Positive Verstärkung, Negative Verstärkung, Positive Bestrafung, Negative Bestrafung — Skinnerbox

Jetzt hat Skinner verschiedene Experimente durchgeführt. Diese schauen wir uns genauer an:

Positive Verstärkung: Die Ratte bekommt immer, wenn sie den Hebel betätigt (Verhalten), Futter (Angenehme Konsequenz). Dadurch zeigt sie das Verhalten häufiger.
Negative Verstärkung: Der Käfigboden der Ratte steht ständig unter Strom. Wenn die Ratte jetzt den Hebel drückt (Verhalten), geht der Strom aus (unangenehme Konsequenz bleibt aus). Sie verhält sich öfter so.
Positive Bestrafung: Die Ratte bekommt immer einen Stromschlag (Unangenehme Konsequenz), wenn sie den Hebel (Verhalten) drückt. Das führt dazu, dass sie das Verhalten seltener zeigt.
Negative Bestrafung: Die vierte Möglichkeit hat Skinner nicht durchgeführt, dabei würde die Ratte immer dann kein Futter erhalten (angenehme Konsequenz bleibt aus), wenn sie den Hebel drückt (Verhalten). Sie vermeidet daraufhin das Verhalten.

Im nächsten Schritt hat er einer Ratte jetzt noch beigebracht, dass sie nur dann Futter bekommt (Angenehme Konsequenz), wenn sie den Hebel drückt (Verhalten) während die Lampe im Käfig leuchtet (Stimulus). Du kannst also ein Verhalten also auch an eine bestimmte Bedingung oder Situation knüpfen.

Die Skinnerbox ist ein wichtiges Beispiel für das operante Konditionieren, schauen wir uns jetzt an, was du im Allgemeinen zu den Verstärkern bei der operanten Konditionierung wissen solltest.

Beispiele für die Operante Konditionierung

Um die verschiedenen Formen der operanten Konditionierung besser zu verstehen, schauen wir uns einige typische Beispiele an.

1. Beispiel für positive Verstärkung

Bei der positiven Verstärkung wird ein Verhalten durch das Hinzufügen eines angenehmen Reizes gefördert.

Beispiel: Ein Schüler lernt fleißig für seine Mathearbeit und erhält dafür eine gute Note und ein Lob vom Lehrer. Durch diese Belohnung lernt der Schüler, dass sich Anstrengung beim Lernen auszahlt. Dadurch wird er motiviert, auch in Zukunft für Prüfungen zu lernen.

2. Beispiel für negative Verstärkung

Negative Verstärkung bedeutet, dass ein unangenehmer Reiz entfernt wird, um ein Verhalten zu fördern.

Beispiel: Für das regelmäßige Zuspätkommen zur Arbeit bekommt ein Mitarbeiter kritische Blicke und Ermahnungen vom Vorgesetzten. Als er beginnt, pünktlich zu erscheinen, bleiben die Ermahnungen aus. Durch das Ausbleiben der negativen Rückmeldungen wird der Mitarbeiter ermutigt, weiterhin pünktlich zu kommen.

3. Beispiel für positive Bestrafung

Positive Bestrafung meint das Hinzufügen eines unangenehmen Reizes, um ein Verhalten zu reduzieren.

Beispiel: Wenn ein Kind seine Hausaufgaben für die Schule nicht macht, wird es ermahnt. Die Ermahnung vor der gesamten Klasse ist für das Kind unangenehm, wodurch sich die Wahrscheinlichkeit verringert, dass das Kind erneut seine Hausaufgaben vernachlässigt.

4. Beispiel für negative Bestrafung

Bei der negativen Bestrafung wird ein angenehmer Reiz entfernt, um ein unerwünschtes Verhalten zu verringern.

Beispiel: Ein Teenager bleibt trotz Verbots lange draußen und bekommt deshalb eine Woche lang kein Taschengeld. Durch das Entziehen des Taschengelds wird ihm ein angenehmer Reiz vorenthalten. Dadurch wird das unerwünschte Verhalten — zu spät nach Hause kommen — weniger attraktiv.

So wirken verschiedene Verstärker auf das Verhalten

Grundsätzlich können Verstärker unterschiedlich oft auftreten. Häufig wird ein Verstärkerplan verwendet. Dabei kannst du die Methoden kontinuierlicher Verstärker, intermittierende Verstärkung und Shaping unterscheiden.

Kontinuierliche Verstärker/Immer-Verstärker

Jedes Mal, wenn das erwünschte Verhalten auftritt, belohnst du es. Bei dieser Art der Verstärkung lernt das Individuum zwar schnell und zeigt das Verhalten häufig. Es verlernt es allerdings auch genauso schnell wieder.

Beispiel: Dein Lehrer lobt dich jedes Mal, wenn du eine richtige Antwort gibst. Da du für jede richtige Antwort unmittelbar positive Rückmeldung erhältst, lernst du schnell, dich aktiv am Unterricht zu beteiligen.

Intermittierende Verstärkung/Manchmal-Verstärkung/Partielle Verstärkung

Hier wird das Verhalten nur hin und wieder verstärkt. Dadurch dauert das operante Lernen zwar länger, aber es ist auch nachhaltiger. Das erwünschte Verhalten wird also längerfristig häufiger gezeigt.

Beispiel: Du gibst deinem Hund gelegentlich ein Leckerli, wenn der Hund auf Befehl sitzt. Da der Hund nicht jedes Mal eine Belohnung erhält, wird er das Verhalten auch dann weiterhin zeigen, wenn das Leckerli ausbleibt. Dies ist besonders nützlich, wenn ein Verhalten auch ohne konstante Belohnung zuverlässig abgerufen werden soll.

Die intermittierende Verstärkung kannst du nochmal gliedern in:

Quotenverstärkung: Es wird zum Beispiel jedes 10. Mal das erwünschte Verhalten verstärkt.
Intervallverstärkung: Es wird zum Beispiel pro Stunde dreimal verstärkt, wenn du das Individuum also in den ersten zehn Minuten dreimal lobst, dann darfst du es die restlichen 50 Minuten nicht mehr loben.

Shaping

Shaping (dt. Verhaltensformung) ist eine spezielle Methode, bei der komplexes Verhalten schrittweise aufgebaut wird. Dafür wird jede Annäherung an das gewünschte Endverhalten belohnt. So kann durch Shaping Verhalten in kleinen Schritten erlernt werden. Das ist insbesondere nützlich, wenn das Endverhalten aus mehreren Teilhandlungen besteht.

Beispiel: Dein Hund soll lernen, eine Rolle zu machen. Zunächst belohnst du ihn, wenn er sich seitlich hinlegt. Im nächsten Schritt belohnst du nur das Verhalten, bei dem er sich weiterdreht. Schließlich erhält er eine Belohnung, wenn er die Rolle vollständig ausführt. Dadurch lernt dein Hund schrittweise die gesamte Bewegung.

Shaping ist besonders in der Verhaltenspsychologie und im Training hilfreich. Vor allem dann, wenn Verhalten entwickelt werden soll, das nicht spontan auftritt oder aus vielen Einzelschritten besteht. Denn durch die stufenweise Annäherung wird das Verhalten aufgebaut, ohne den Lernenden zu überfordern.

Welche Arten von Verstärkern gibt es?

Als Verstärker können verschiedene Gegenstände und Handlungen dienen. Du kannst bei der operanten Konditionierung nochmal wie folgt unterscheiden:

Primäre Verstärker: Sie befriedigen physiologische Bedürfnisse, wie Nahrung oder Trinken.
Sekundäre Verstärker: Sie sind nicht lebensnotwendig. Du hast bereits gelernt, dass sie erstrebenswert sind wie Lob, gute Noten, die Erlaubnis oder Befugnis für etwas.
Materielle Verstärker: Dazu zählst du alle Gegenstände, die mit materiellem Aufwand verbunden sind wie Blumen und Schokolade, aber auch Geld und Gehalt.
Handlungsverstärker: Du belohnst mit einer angenehmen Tätigkeit, wie einem Kinobesuch oder mit anderen Freizeitaktivitäten.
Soziale Verstärker: Belohnung durch angenehmen zwischenmenschlichen Kontakt, wie Lob, Beifall, Anlächeln oder Anerkennung.

Ein Verstärker kann gleichzeitig zu mehreren Kategorien gehören. So ist Lob beispielsweise gleichzeitig ein sekundärer und ein sozialer Verstärker.

Wie wirksam sind die Verstärker?

Die einzelnen möglichen Verstärker sind unterschiedlich wirksam. Das heißt, dass ein Individuum die Verhaltensweise durch einen bestimmten Verstärker schneller lernt als durch einen anderen Verstärker. Die Wirksamkeit des Verstärkers der operanten Konditionierung ist von Folgendem abhängig:

Person (Bsp. ein Schoko-Liebhaber freut sich über eine Tafel Schokolade stärker als jemand, der keine Süßigkeiten mag)
Situation (Bsp. Wenn du gerade schon eine Tafel Schokolade als Belohnung bekommen hast, freust du dich über eine zweite deutlich weniger)
Kultur und Sozialisation (Bsp. Prestige und Reichtum ist zum Beispiel in den unterschiedlichen Kulturen und in den unterschiedlichen sozialen Schichten unterschiedlich angesehen)
Lobende Person (Bsp. Du freust dich mehr, wenn du von deinem Trainer gelobt wirst, als wenn dich jemand lobt, der weniger Erfahrung hat)
Zeit (Bsp. Wenn du eine Tafel Schokolade für eine bestimmte Verhaltensweise bekommst, bringt es mehr, wenn du sie unmittelbar nach den Verhalten bekommst, als wenn sie dir ein Jahr später überreicht wird)

Warum verlernst du ein Verhalten? — Extinktion und spontane Erholung

Wenn eine Verhaltensweise einmal gelernt ist, bleibt die Belohnung häufig aus. Das führt aber zur Extinktion (=Löschung) der Verhaltensweise. Das heißt also, dass du die erlernte Verhaltensweise wieder „verlernst“. Das erwünschte Verhalten wird dadurch seltener gezeigt, wenn es nicht mehr belohnt wird.

Es kann aber auch sein, dass die Verhaltensweise ohne Verstärkung erst mal übermäßig auftritt, weil die angenehmen Konsequenzen so ungeduldig eingefordert werden. Nach einiger Zeit legt sich aber auch das und die Verhaltensweise wird nicht mehr absichtlich gezeigt.

Eine andere Möglichkeit, wie ein Individuum das Ausbleiben eines Verstärkers auffassen kann, ist, dass es als Bestrafung interpretiert wird. Dadurch wird das Verhalten noch schneller „verlernt“.

Unabhängig davon, wie die Extinktion verläuft, tritt häufig dieses Phänomen auf: Das Verhalten wird nach einiger Zeit einfach trotzdem spontan und grundlos wieder gezeigt, ohne dass es nochmal verstärkt wurde. Nimmt dann aber auch wieder ab. Das nennst du spontane Erholung.

Operante Konditionierung, Verlauf, Verstärkung, Verstärker, Verlernen — Extinktion & spontane Erholung

Unterschied zwischen klassischer und operanter Konditionierung

Klassische und operante Konditionierung sind zwei verschiedene Lernmethoden, um das Verhalten zu beeinflussen. Sie unterscheiden sich aber anhand eines wichtigen Punktes: Die klassische Konditionierung hat das Ziel, dass jemand automatisch auf einen bestimmten Reiz reagiert. Die operante Konditionierung hingegen möchte durch Belohnung oder Bestrafung ein aktives Verhalten hervorrufen.

klassische Operationalisierung	operante Konditionierung
Das Verhalten passiert automatisch als Reaktion auf einen bestimmten Reiz, ohne etwas dafür zu tun.	Das Verhalten wird bewusst gezeigt, da etwas Bestimmtes erreicht werden will, z. B. eine Belohnung.
Beispiel: Wenn ein Hund das Geräusch einer Futterdose hört, beginnt er zu speicheln, weil er das Geräusch mit Futter verbindet. Das Speicheln passiert dabei automatisch.	Beispiel: Ein Hund lernt, sich auf Kommando hinzusetzen, weil er dafür ein Leckerli bekommt. Der Hund setzt sich aktiv hin, weil er eine Belohnung (das Leckerli) erwartet.
Verwendung: um Gewohnheiten oder Reflexe zu beeinflussen	Verwendung: um Verhalten gezielt zu fördern

Operante Konditionierung — häufigste Fragen

(ausklappen)

Was ist die operante Konditionierung nach Skinner?

Operante Konditionierung nach Skinner bedeutet, dass die Häufigkeit eines Verhaltens über seine Konsequenzen gesteuert wird. Führt ein Verhalten zu einer Belohnung, wird es wahrscheinlicher. Führt es zu einer Bestrafung oder fällt eine Belohnung weg, wird es unwahrscheinlicher.
Welche Beispiele für operante Konditionierung gibt es im Alltag?

Beispiele für operante Konditionierung im Alltag sind Situationen, in denen Konsequenzen dein Verhalten verändern. Zum Beispiel lernst du häufiger, wenn du für gute Mitarbeit Lob bekommst. Du kommst eher pünktlich, wenn sonst eine unangenehme Ermahnung folgt. Du räumst seltener auf, wenn danach kein Taschengeld kommt.
Welche Beispiele gibt es für operante Konditionierung bei Hunden?

Beispiele für operante Konditionierung bei Hunden sind Trainingssituationen, in denen der Hund für sein Verhalten eine Konsequenz erlebt. Zum Beispiel bekommt der Hund ein Leckerli, wenn er sich auf Kommando hinsetzt, und setzt sich dann häufiger. Bleibt das Leckerli aus, wird das Verhalten seltener.
Was ist der Unterschied zwischen negativer Verstärkung und negativer Bestrafung?

Negative Verstärkung bedeutet, dass ein unangenehmer Reiz wegfällt und du ein Verhalten deshalb häufiger zeigst. Negative Bestrafung bedeutet, dass ein angenehmer Reiz wegfällt und du ein Verhalten deshalb seltener zeigst. Zum Beispiel: Lärm hört auf, wenn du handelst, versus Handy wird weggenommen.

Klassische Konditionierung

Jetzt weißt du alles über die operante Konditionierung. Wenn du auch noch mehr über die klassische Konditionierung wissen möchtest, schau hier in unserem Video vorbei!