Named Entity Recognition
Named Entity Recognition (NER) oder der sperrigere deutsche Begriff Eigennamenerkennung beschreibt den Vorgang der Identifizierung und Klassifizierung von Eigennamen in Texten. Entity Extraction oder Entity Classification werden oft Synonym gebraucht.
Eigennamen bzw. named entities, wie Orte, Individuen, Organisationen, Städte, Daten oder Produkte werden von darauf trainierten Systemen automatisch in Texten identifiziert und in die passende Kategorie klassifiziert.
Einsatzzwecke von Named Entity Recognition
Named Entity Recognition findet immer dann Einsatz, wenn große Mengen an Text kategorisiert werden müssen. Ein einfaches Beispiel ist die Verschlagwortung von Artikeln. Ein System zur (NER) kann aus den gesamten Artikeln einer oder mehrerer Nachrichtenseiten die relevanten Personen, Organisationen oder Orte extrahieren und Schlagworte als Meta-Informationen hinzufügen.
Komplexere Beispiele zum Einsatz von Named Entity Recognition finden sich im Bereich Customer Relationship Management oder Produktmanagement.
Beispiel Named Entity Recognition im Produktmanagement Automotive
Surveys, Reviews und Testberichte können mit mittels Named Entity Recognition erlernte Typenbezeichnungen, wie z.B. „Z-Klasse“ oder „17er CNX“ erkennen und die vorhandenen Daten entsprechend teilen. Komplexere Named Entity Recognition Systeme, wie z.B. die von Deep Data Analytics genutzten, ermöglichen eine kleinteiligere Segmentierung der Typen Texte in unterschiedliche Attribute, z.B. Texte bei denen es um das Lenkrad oder andere Bedienelemente geht.
Das Lenkrad[Produktelement] der neuen Z Klasse[Produkt] ist griffig, wobei ich die Bedienelemente[Produktelemente] des neuen 17er[Produkt] als ergonomischer empfinde. Meine Frau[Person] mag das Entertainmentsystem[Produktelement] in der Z-Klasse[Produkt] lieber.
Beispiel Named Entity Recognition in Customer Relationship Management
Oft strömen eine Vielzahl von Support Anfragen auf eine Organisation ein. Chat, E-Mail, twitter und Messangerdienste werden von Nutzern mit wachsender Begeisterung genutzt. Besonders in großen Unternehmen werden die einzelnen Kanäle von unterschiedlichen Teams betreut, so dass es schwierig ist, einen Trend in den Kundenanfragen zu identifizieren.
Named Entity Recognition kann die Gesamtheit der eingehenden Kundenkommunikation klassifizieren und wichtige Aspekte sichtbar machen. Löst ein spezifisches Produkt(Attribut) Nachfragen oder Beschwerden aus oder gibt es geographische Auffälligkeiten? NER ermöglicht es, die eingehenden Anfragen kanalübergreifend zu analysieren und nach unterschiedlichen Gesichtspunkten zu klassifizieren.
Der Fahrkartenautomat[Produkt] am Marienplatz[Ort] ist regelmäßig defekt und ich muss mit dem Kontrolleur[Person] diskutieren, warum ich kein Ticket[Produkt] habe.
Auf diesem Weg lassen sich große unstrukturierte Datenmengen strukturieren und mit Meta Informationen anreichen. Die mittels NER klassifizierten Texte stehen im folgenden passgenau segmentiert zur weiteren Analyse bereit.
Deep Data Analytics nutzt industriespezifische Word Embeddings, die wir domainspezifisch trainiert haben, in einem bidirektionalen LSTM Netzwerk, um Zusammenhänge in den Daten besser modellieren zu können.