Sind KI und NLP dasselbe?

Künstliche Intelligenz (KI) und Natural Language Processing (NLP) sind nicht dasselbe, weil NLP ein Teilbereich von KI ist. NLP beschäftigt sich speziell damit, gesprochene und geschriebene Sprache zu verstehen, zu verarbeiten und zu erzeugen. KI umfasst dagegen auch viele andere Aufgaben außerhalb von Sprache.

Was sind NLP-Methoden?

NLP-Methoden sind grundlegende Ansätze, mit denen man Aufgaben der Sprachverarbeitung löst. Regelbasiertes NLP nutzt feste sprachliche Regeln, statistisches NLP nutzt Wahrscheinlichkeiten aus großen Textmengen, und Deep-Learning-NLP nutzt neuronale Netze, die Muster und Kontext aus sehr vielen Beispielen lernen. Je nach Aufgabe kann ein Ansatz besser passen als ein anderer.

ChatGPT ist NLP, weil es Sprache verarbeitet und selbst Text erzeugt. ChatGPT gehört dabei zum Deep-Learning-NLP, weil ein neuronales Netz mit sehr vielen Texten trainiert wird, um Kontext und Bedeutung von Wörtern in verschiedenen Zusammenhängen zu erfassen. So kann es auf Eingaben in natürlicher Sprache reagieren.

Was ist der Unterschied zwischen Constituency Parsing und Dependency Parsing?

Constituency Parsing und Dependency Parsing unterscheiden sich darin, ob man einen Satz in Wortgruppen oder in Abhängigkeiten zwischen einzelnen Wörtern zerlegt. Beim Constituency Parsing wird „Der Hund läuft schnell“ in die Nominalphrase „Der Hund“ und die Verbphrase „läuft schnell“ geteilt. Dependency Parsing zeigt dagegen, dass „Hund“ vom Verb „läuft“ abhängt und „schnell“ das Verb näher beschreibt.

Video

Hier geht's zum Video „Wortarten“

Hier geht's zum Video „Reinforcement Learning“

Zurück zum Text

Weiter lernen Empfohlenes passendes Video

Natural Language Processing (NLP)

Wichtige Inhalte in diesem Video

Was ist Natural Language Processing?

(00:17)

Wie funktioniert Natural Language Processing?

(00:52)

Aufgaben von NLP

(02:43)

Anwendungen von Natural Language Processing

(03:40)

Hast du dich schon einmal gefragt, wie Chatbots es schaffen, unsere Sprache zu verstehen und mit uns zu kommunizieren? Dahinter steckt Natural Language Processing. Wie das funktioniert, zeigen wir dir hier und im Video !

Inhaltsübersicht

Was ist Natural Language Processing?

im Videozur Stelle im Video springen

(00:17)

Natural Language Processing, kurz NLP, ist ein Teilbereich der künstlichen Intelligenz (KI). Es ermöglicht Computern, gesprochene und geschriebene Sprache zu verstehen, zu verarbeiten und zu erzeugen.

NLP ist dadurch eine Art Schnittstelle zwischen Mensch und Maschine, die uns die Möglichkeit gibt, mit Computern zu interagieren. Das machen wir sogar mittlerweile täglich: Wenn wir unser Smartphone nach dem Wetter fragen oder ChatGPT bitten eine Zusammenfassung zu erstellen — überall steckt NLP dahinter.

Durch Natural Language Processing können Maschinen den Inhalt und Kontext von Sprache erkennen. Es übersetzt unsere komplexe Sprache in eine für Computer verständliche Form und wandelt die Computerantworten wieder in eine für uns Menschen verständliche Sprache um.

Wie funktioniert Natural Language Processing?

im Videozur Stelle im Video springen

(00:52)

Damit Computer die komplexe Struktur unserer Sprache analysieren können, durchläuft NLP 7 Schritte:

Die Grafik zeigt die sieben grundlegenden Verarbeitungsschritte der natürlichen Sprachverarbeitung von der Spracherkennung über Tokenisierung, Standardisierung und Stopwort-Analyse bis hin zu Lemmatisierung, Part-of-Speech-Tagging und Parsing. — Die 7 Schritte bei Natural Language Processing

Spracherkennung: Diese Aufgabe wird oft auch als Speech-to-Text bezeichnet und besteht darin, gesprochene Sprache in Text umzuwandeln. Dabei muss das System gesprochene Wörter trotz verschiedener Akzente, Sprechgeschwindigkeiten und Betonungen präzise erkennen und in Textform übertragen. Wenn die Eingabe schon in Textform vorliegt, wird dieser Schritt übersprungen.
Tokenisierung: Hier unterteilt NLP den Text zuerst in einzelne Sätze und anschließend in Wörter. Falls Satz- und Leerzeichen zwischen einzelnen Wörtern verwendet werden, ist das relativ einfach.
Standardisierung: Anschließend standardisiert die Maschine den Text indem alle Zeichen in Kleinbuchstaben umgewandelt werden. Das ist beispielsweise in der Kundenfeedback-Analyse wichtig: Wenn Nutzer ihre Feedbacks unterschiedlich formatieren, etwa mit „Gut“ oder „gut“, könnte ein unstandardisiertes System diese Bewertungen unterschiedlich behandeln.
Stopwort-Analyse: Bei diesem Schritt entfernt NLP sogenannte Stopwörter aus dem Text. Stopwörter sind häufig vorkommende Wörter wie „der“, „und“, „in“, „auf“, die wenig bis keine Bedeutung für die Analyse des Textinhalts haben. Sie werden vorübergehend entfernt, um den Fokus auf wichtigere Wörter zu legen und die Effizienz der Analyse zu verbessern. Zum Beispiel wird der Satz „Die Katze schläft auf dem Sofa.“ zu: „Katze schläft Sofa“.
Lemmatisierung: Das ist eine Technik im NLP, bei der ein Wort auf seine Grundform, das sogenannte Lemma, zurückgeführt wird. Zum Beispiel werden die Wörter „geht“, „ging“ und „gegangen“ alle auf das Lemma „gehen“ zurückgeführt. Das macht es Maschinen leichter, die Bedeutung und Struktur eines Textes zu analysieren, da verschiedene Formen eines Wortes vereinheitlicht werden.
Part-of-Speech-Tagging: Bei diesem Prozess ordnet der Computer den einzelnen Wörtern Wortarten zu, wie zum Beispiel Nomen. Verb oder Adjektiv.

Überwachtes und unüberwachtes Lernen

Um die Wortarten zu bestimmen, nutzen Computer zwei Arten von maschinellem Lernen: überwachtes und unüberwachtes Lernen.

Beim überwachten Lernen lernt der Computer anhand von Beispielen, die Wortarten zu bestimmen. Zum Beispiel bekommt er einen Satz wie „Der Hund läuft schnell“ bei dem „Hund“ als Nomen, „läuft“ als Verb und „schnell“ als Adverb markiert sind. Anhand dieser markierten Sätze erkennt der Computer Muster und kann diese auf neue Texte anwenden.

Beim unüberwachten Lernen bekommt der Computer Texte ohne solche Markierungen. Er findet selbstständig Muster und erstellt eigene Kategorien für Wortarten.
Parsing: Im letzten Schritt geht es darum, die Beziehungen zwischen den Wörtern und Satzteilen zu verstehen. Dieser Vorgang heißt Parsing und spielt eine entscheidende Rolle, um die Syntax und Bedeutung der Sprache zu entschlüsseln. Es werden zwei zentrale Methoden eingesetzt: Constituency Parsing und Dependency Parsing.

Beim Constituency Parsing wird ein Satz in hierarchische Strukturen zerlegt — ähnlich wie ein Baumdiagramm, das Haupt- und Nebensätze sowie Wortgruppen wie Subjekte und Prädikate zeigt. Der Beispielsatz „Der Hund läuft schnell“ wird aufgeteilt in die Nominalphrase „Der Hund“ und die Verbphrase „läuft schnell“. Innerhalb dieser Phrasen gibt es wiederum einzelne Wörter als Bestandteile.

Die Grafik zeigt anhand des Beispielsatzes „Der Hund läuft schnell“, wie ein Satz beim Constituency Parsing in Nominalphrase und Verbphrase zerlegt wird und diese weiter in ihre grammatischen Bestandteile gegliedert sind. — Constituency Parsing

Dependency Parsing geht einen Schritt weiter, indem es die Beziehungen und Abhängigkeiten zwischen den Wörtern eines Satzes analysiert. Statt nur die Satzstruktur zu betrachten, legt es den Fokus darauf, wie Wörter miteinander verbunden sind und welche grammatikalischen Funktionen sie erfüllen. Beispielsweise zeigt Dependency Parsing, dass das Subjekt „Hund“ von dem Verb „läuft“ abhängt, während „schnell“ das Verb näher beschreibt.

Abbildung zum Dependency Parsing — Dependency Parsing

Übrigens: NLP lässt sich in die zwei Bereiche Natural Language Understanding (NLU) und Natural Language Generation (NLG) unterteilen. NLU ist dafür verantwortlich, dass Maschinen die Bedeutung von Sprache verstehen, indem sie Texte analysieren und interpretieren. NLG hingegen erzeugt aus Daten verständliche Sprache oder Texte, die von Menschen genutzt werden können.

Studyflix vernetzt: Hier ein Video aus einem anderen Bereich

Nach Beantwortung speichern wir deine Antwort, um Studyflix zu verbessern. Mehr dazu erfährst du in unserer Datenschutzerklärung.

Aufgaben von NLP

im Videozur Stelle im Video springen

(02:43)

Neben den bereits genannten Schritten muss NLP viele weitere Aufgaben bewältigen, um die komplexe Struktur von Sprache vollständig zu verstehen.

Referenzauflösung: Diese Aufgabe besteht darin, Bezüge innerhalb eines Textes zu erkennen. Zum Beispiel bei dem Satz „Peter kaufte ein Buch. Er las es am selben Abend.“ muss das System verstehen, dass sich „Er“ auf Peter und „es“ auf das Buch bezieht.
Named Entity Recognition (NER): Hierbei geht es darum, wichtige Entitäten wie Namen von Personen, Orten oder Organisationen in einem Text zu erkennen. Zum Beispiel in einem Satz wie „Angela Merkel besuchte Berlin.“ erkennt das System „Angela Merkel“ als Person und „Berlin“ als Ort.
Wortbedeutungsklärung: Hier versucht NLP, bei mehrdeutigen Wörtern die passende Bedeutung aus dem Kontext zu ermitteln. So kann das System unterscheiden, ob „Bank“ sich auf ein Finanzinstitut oder eine Sitzgelegenheit bezieht.
Stimmungsanalyse: Bei dieser Aufgabe analysiert NLP die emotionale Ausrichtung eines Textes. Zum Beispiel wird in Kundenbewertungen analysiert, ob die Meinung positiv, neutral oder negativ ist.

Methoden von NLP

Um die verschiedenen Aufgaben zu erfüllen und die erforderlichen Schritte umzusetzen, verwendet NLP drei verschiedene Ansätze. Jede der drei Methoden bietet unterschiedliche Herangehensweisen um NLP-Aufgaben zu bewältigen:

Regelbasiertes NLP: Dieser Ansatz beruht auf festgelegten grammatikalischen und sprachlichen Regeln, die von Experten erstellt werden. Ein Beispiel wäre die Verwendung von Regeln, um Satzstrukturen wie Subjekt-Prädikat-Objekt zu identifizieren. Ein regelbasiertes System kann z. B. in „Der Hund bellt.“ erkennen, dass „Hund“ das Subjekt und „bellt“ das Prädikat ist.
Statistisches NLP: Hierbei werden statistische Modelle verwendet, um Vorhersagen über Sprache zu treffen. Diese Modelle basieren auf Wahrscheinlichkeiten, die aus großen Textmengen gelernt werden. Ein Beispiel ist die automatische Vorhersage des nächsten Wortes in einer Nachrichteneingabe, basierend auf vorherigen Wörtern — wie es bei Handys häufig der Fall ist.
Deep Learning NLP: Dieser moderne Ansatz verwendet neuronale Netze, um große Datenmengen zu analysieren und Muster zu lernen. Deep-Learning-Modelle wie GPT oder BERT werden mit sehr vielen Texten trainiert, um den Kontext und die Bedeutung von Wörtern in verschiedenen Zusammenhängen zu verstehen. Beispiele dafür sind Sprachassistenten wie Siri oder Alexa, die auf Basis von Deep-Learning-Algorithmen arbeiten, um komplexe Anfragen zu beantworten.

Anwendungen von Natural Language Processing

im Videozur Stelle im Video springen

(03:40)

Für NLP gibt es abseits von Sprachassistenten und Chatbots noch viele weitere Anwendungsbereiche. Hier sind einige Beispiele:

Automatische Übersetzung
NLP spielt auch eine wichtige Rolle bei der maschinellen Übersetzung, wie sie in Diensten wie Google Translate verwendet wird. Hier analysiert das System den Ausgangstext, um die richtige Übersetzung basierend auf Syntax, Semantik und Kontext zu liefern. Moderne Übersetzungstools werden immer präziser, da sie durch maschinelles Lernen große Datenmengen verwenden, um bessere Ergebnisse zu erzielen.
Textklassifizierung
Ein weiterer wichtiger Bereich ist die Kategorisierung von Texten. Dabei geht es darum, Texte automatisch in verschiedene Kategorien einzuordnen. Ein bekanntes Beispiel sind Spamfilter, die anhand bestimmter Muster und Schlüsselwörter erkennen, ob eine E-Mail in den Spam-Ordner verschoben werden sollte.
Textzusammenfassung
Mit NLP lassen sich große Mengen an Text analysieren, um gezielt wichtige Informationen herauszufiltern. Diese Technik wird in Nachrichtendiensten verwendet, die lange Texte automatisch zusammenfassen, oder in Programmen, die gezielt relevante Daten aus einem Text extrahieren.
Grammatik- und Rechtschreibprüfung
NLP wird auch in Programmen eingesetzt, die Grammatik- und Rechtschreibfehler erkennen und korrigieren. Bekannte Tools wie Grammarly oder die in Word integrierte Rechtschreibprüfung nutzen NLP-Algorithmen, um Texte zu analysieren und Vorschläge für Verbesserungen zu machen.

Herausforderungen von NLP

NLP-Systeme stehen vor der schwierigen Aufgabe, die Komplexität der menschlichen Sprache zu erfassen. Von grammatischen Regeln bis hin zu regionalen Unterschieden gibt es viele Hindernisse, die überwunden werden müssen.

Sprachliche Varianz
Eine der größten Schwierigkeiten für NLP-Systeme ist die Vielfalt der Sprache. Menschen verwenden Dialekte, Akzente, Slang und regionale Ausdrücke, die von den Standardformen einer Sprache abweichen. Hinzu kommt, dass ständig neue Wörter erfunden oder aus anderen Sprachen übernommen werden, was die Sprachverarbeitung weiter erschwert. Auch grammatikalische Regeln können sich mit der Zeit verändern oder bewusst missachtet werden, was zu Unsicherheiten bei der Interpretation führen kann.
Emotion und Betonung
Eine weitere Hürde für NLP-Systeme ist das Erkennen von Emotionen, Ironie oder Sarkasmus in Texten oder gesprochener Sprache. Diese subtilen Aspekte der Kommunikation erfordern ein tiefes Verständnis des Kontextes und der Intention des Sprechers, was für Maschinen schwierig zu erreichen ist. Emotionale Nuancen, die Menschen intuitiv erfassen, können von NLP-Modellen leicht übersehen oder falsch interpretiert werden.
Rechenaufwand und Energieverbrauch
Das Trainieren und Anwenden großer NLP-Modelle erfordert erhebliche Rechenressourcen und Energie. Dies stellt sowohl eine technische Herausforderung als auch eine umweltbezogene Problematik dar, da der Energieverbrauch dieser Systeme mit der wachsenden Nachfrage nach KI-Anwendungen steigt.
Bewertung der Ergebnisse
Eine Herausforderung in NLP-Projekten besteht darin, die Qualität der Ergebnisse zuverlässig zu bewerten. Während einfache Aufgaben wie die Klassifikation von Texten leicht überprüfbar sind, ist es bei komplexeren Aufgaben wie der Textzusammenfassung schwieriger. Das liegt daran, dass es nicht immer eine eindeutige „richtige“ Antwort gibt.

Reinforcement Learning

Eine wichtige Methode des maschinellen Lernens, die auch im Bereich NLP genutzt wird ist Reinforcement Learning. Wie dieser Ansatz funktioniert, erfährst du in unserem Video dazu!

Natural Language Processing (NLP) — häufigste Fragen

(ausklappen)

Sind KI und NLP dasselbe?

Künstliche Intelligenz (KI) und Natural Language Processing (NLP) sind nicht dasselbe, weil NLP ein Teilbereich von KI ist. NLP beschäftigt sich speziell damit, gesprochene und geschriebene Sprache zu verstehen, zu verarbeiten und zu erzeugen. KI umfasst dagegen auch viele andere Aufgaben außerhalb von Sprache.
Was sind NLP-Methoden?

NLP-Methoden sind grundlegende Ansätze, mit denen man Aufgaben der Sprachverarbeitung löst. Regelbasiertes NLP nutzt feste sprachliche Regeln, statistisches NLP nutzt Wahrscheinlichkeiten aus großen Textmengen, und Deep-Learning-NLP nutzt neuronale Netze, die Muster und Kontext aus sehr vielen Beispielen lernen. Je nach Aufgabe kann ein Ansatz besser passen als ein anderer.
Ist ChatGPT NLP?

ChatGPT ist NLP, weil es Sprache verarbeitet und selbst Text erzeugt. ChatGPT gehört dabei zum Deep-Learning-NLP, weil ein neuronales Netz mit sehr vielen Texten trainiert wird, um Kontext und Bedeutung von Wörtern in verschiedenen Zusammenhängen zu erfassen. So kann es auf Eingaben in natürlicher Sprache reagieren.
Was ist der Unterschied zwischen Constituency Parsing und Dependency Parsing?

Constituency Parsing und Dependency Parsing unterscheiden sich darin, ob man einen Satz in Wortgruppen oder in Abhängigkeiten zwischen einzelnen Wörtern zerlegt. Beim Constituency Parsing wird „Der Hund läuft schnell“ in die Nominalphrase „Der Hund“ und die Verbphrase „läuft schnell“ geteilt. Dependency Parsing zeigt dagegen, dass „Hund“ vom Verb „läuft“ abhängt und „schnell“ das Verb näher beschreibt.

Sprachverarbeitung verstehen

Natural Language Processing gehört zur Sprachverarbeitung und verbindet menschliche Sprache mit Informatik und KI. Du ordnest in diesem Themenfeld ein, wie Computer Sprache erkennen, auswerten und für verschiedene Anwendungen nutzen. So wird klar, wie aus Wörtern, Sätzen und Kontext verwertbare Informationen für ein System werden. Im Informatikbereich findest du passende Videos zu diesem und verwandten Themen.