Vertiefung der NLU-Komponente für Dialogsysteme: Intent-Klassifikation und Entity-Extraktion sind die zwei Kerntasks. Ergänzt wird dies durch POS-Tagging, Named Entity Recognition und Feature-Repräsentationstechniken.
Relevanz: Lernziele: POS-Tagging und NER erklären; Intent-Klassifikation und Entity-Extraktion als zentrale NLU-Tasks in Dialogsystemen beschreiben; Preprocessing-Schritte für NLU-Pipelines kennen.
IntentDie Absicht oder das Ziel hinter einer Nutzeräusserung in einem Dialogsystem (z.B. «Flug buchen», «Bestellung aufgeben»).EntitySchlüsselbegriff in einer Äusserung, der spezifische Informationen trägt (z.B. Personenname, Datum, Produktname).POS-TagLabel zur Kennzeichnung der Wortart eines Tokens, basierend auf dem Penn-Treebank-Tagset (z.B. NN = Noun singular, VBZ = Verb 3rd person present, JJ = Adjective).NER (Named Entity Recognition)ML-basiertes Verfahren zur automatischen Erkennung und Klassifikation von Eigennamen in Text; nutzt OntoNotes-5-Tagset.BERTBidirektionales Transformer-Modell (Bidirectional Encoder Representations from Transformers); liefert kontextabhängige Worteinbettungen; State-of-the-Art für NLU-Tasks.RoBERTaOptimierte Variante von BERT mit robusterer Trainingsstruktur; ebenfalls für Feature Representation in NLU verwendet.Penn Treebank TagsetStandardisiertes Set von POS-Tags für das Englische, u.a. DT (Determiner), JJ (Adjective), NN (Noun), VBZ (Verb 3rd sg. present), IN (Preposition).OntoNotes 5Annotierter Datensatz und Tagset für NER; definiert Entitätskategorien wie PERSON, ORG, GPE (geopolitische Einheit), DATE etc. ---