Text Analytics Anwendungsfälle einfach erklärt

Gastbeitrag von | 06.08.2020

Von neuen Fortschritten im Natural Language Processing liest man kontinuierlich in den Fachnachrichten, vor allem IBM Watson¹, aber auch neuere KI-Ansätze wie ELMo² oder BERT³ oder jetzt ganz aktuell GPT-3, der im Turing-Test erstaunliche Ergebnisse liefert. Und sogar zum Eingrenzen der Covid-19-Pandemie gibt es Aufrufe, die Macht des NLP zum Guten zu nutzen.

Text Analytics und Natural Language Processing (NLP) befassen sich mit allen Arten der automatischen Verarbeitung von Texten und bauen häufig auf maschinellem Lernen oder Ansätzen der künstlichen Intelligenz auf. Statt zu erklären, wie Text Analytics technisch funktioniert (das findet sich woanders von größeren Geistern schöner beschrieben), möchte ich erklären, was mit Text Analytics inhaltlich möglich ist.

Wer sind die Stakeholder von Text Analytics? Und was sind ihre Anwendungsfälle?

Grundsätzlich gibt es vier Hauptgruppen, die sich für die Verwendung von Text Analytics interessieren:

  • Personen, die Text schreiben.
  • Personen, die insbesondere lange Texte lesen.
  • Personen, die für große Texte verantwortlich sind, entweder als Vorgesetzter oder als Qualitätsberater
  • und Personen, die Texte als Eingabe für Folgeaktivitäten verwenden.

 

Text Analytics Anwendungsfälle
Kurz gesagt, diese vier Rollen können wie folgt vom Text profitieren:

  • Der Schreiber: Text Analytics unterstützt Textersteller objektiv direkt beim Schreiben.
  • Der Leser: Text Analytics bringt Licht ins Dunkel.
  • Der Qualitätsmanager oder Vorgesetzte: Text Analytics hilft bei der Qualitätssicherung, wenn der Text nicht mehr überschaubar ist.
  • Der Nutzer des Textes: Text Analytics ermöglicht es den Wert aus dem Chaos zu extrahieren.

Im Folgenden werde ich zeigen, welche relevanten Fragen Text Analytics für jede dieser Rollen beantworten kann.

Anwendungsfall 1: Text Analytics unterstützt Textersteller objektiv direkt beim Schreiben

Stellen Sie sich für den ersten Anwendungsfall vor, dass Sie einen Text schreiben müssen. Zum Beispiel einen Blogbeitrag, eine Anforderung, ein Testfall, ein Vertrag etc. Es gibt so viele verschiedene Qualitätsaspekte, über die Sie wahrscheinlich nachdenken. Sie fragen sich (hoffentlich):

Ein automatischer Text Analytics-Ansatz kann Ihnen sofortiges Feedback zu Ihrem Text geben. Und Ihre Kollegen können sich auf den eigentlichen Inhalt konzentrieren, anstatt auf Unternehmensrichtlinien und Sprachprobleme, wie wir in dieser Studie herausgefunden haben.

Sie merken: Für Sie als Textersteller umfasst Text Analytics nicht nur altbekannte Sprachprüfungen wie Rechtschreibprüfung oder Grammatikanalysen, das Potential geht weit darüber hinaus. Besonders spannend wird es dann, wenn Sie direkt, objektiv und vollautomatisch anwendungsspezifisches Verbesserungsvorschläge auf spezielle Dokumenttypen wie zum Beispiel Vertragstexte, Anforderungen oder Testfälle erhalten.

Feedback im Qualicen Scout

Screenshot: Der Qualicen Scout gibt sofort Feedback.

Text Analytics kann Sie als Textersteller jedoch in mehr als nur dieser Hinsicht unterstützen. Beispielsweise kann Ihnen Text Analytics sogar helfen, indem Sie ganze Textblöcke künstlich erstellen. Ein gutes Beispiel hierfür ist TextSynth, ein Tool basierend auf GPT-2 mit dem jeder Text, der als Eingabe angegeben wird, Wort für Wort vervollständigt wird. Was mit dem gerade veröffentlichten Nachfolger GPT-3 möglich ist, lässt einem den Atem stocken: Ein Machine beantwortet in natürlicher Sprache selbst relativ komplexe Wissens- und Logikfragen. Zwar nicht immer richtig, aber in Art und Weise doch schon sehr komplex.
GPT-3 im Turing-Test: Ist das ein Mensch oder eine Maschine?
Screenshot: GPT-3 im Turing-Test auf http://lacker.io/ai/2020/07/06/giving-gpt-3-a-turing-test.html. Ist das ein Mensch oder eine Maschine?

Anwendungsfall 2: Bringen Sie Licht ins Dunkel für die Leser

Ich beschäftige mich sehr oft mit dem zweiten Anwendungsfall. Es kommt vor, dass mir jemand ein hundertseitiges Dokument (oder größer) sendet und mich um mein Feedback bittet. Hier muss ich schnell die Themen oder Schlüsselbegriffe verstehen, über die der Text spricht. Manchmal suche ich nach bestimmten Textpositionen, z. B. nach allen Stellen, die über meine Komponente im System sprechen. In der perfekten Welt möchte ich jedoch nicht jedes Wort lesen, sondern eine Zusammenfassung jedes Absatzes erhalten: Worüber spricht dieser Absatz? Wenn ich beispielsweise Audits zu Anforderungen durchführe, möchte ich wissen, welche Absätze Anforderungen enthalten und welche Teile nur Überleitungen oder Erklärungen sind. Und schließlich bekomme ich oft mehrere Dokumente im Paket geschickt. Hier muss ich also wissen, wie die Beziehungen zwischen den verschiedenen Dokumenten sind: Wie verhalten sie sich zueinander, wie stark überlappen sie sich?

Und wissen Sie, was fantastisch ist? Für all diese Fragen gibt es bereits Text Analytics-Ansätze. Klar, für einige Themen, wie die automatische Textzusammenfassung, sind die Ergebnisse noch etwas wackelig. Für andere, wie zum Beispiel die Beziehungen zwischen Texten, gibt es bereits etablierte Algorithmen. Und es entstehen immer wieder neue Bibliotheken für ein stärker semantisches Verständnis von Wörtern, die in Hunderten, wenn nicht gar Tausenden von Projekten verwendet werden. Hier ist ein Beispiel, in dem wir zusammen mit der DKE an einer Klassifizierung von Texten in Anforderungen gearbeitet haben:

Anforderungen automatisch erkennen

Screenshot: In diesem Projekt helfen wir dabei, Anforderungen in einem ISO-Standard automatisch zu erkennen und zu kennzeichnen.

Anwendungsfall 3: Qualitätssicherung, wenn der Text nicht mehr überschaubar ist, für Vorgesetzte oder Qualitätsmanager

Eine spezielle Variante von Anwendungsfall 2 besteht darin, die Qualität einer riesigen Textsuite zu verstehen, normalerweise im Laufe der Zeit. In zu vielen Fällen ist ein 200-seitiges Textdokument wie ein schwarzes Loch für Vorgesetzte. Sie kennen diese “Parallelwelten”: Niemand, der in diese Unterwelt hinab getaucht ist, um zu verstehen, was dort vor sich geht, hat es jemals wieder zurück an die Oberfläche geschafft. Dies ist besonders gefährlich, wenn es um Qualität geht. Wenn ein Unternehmen beispielsweise eine neue Schulung einführt, eine neue Richtlinie oder einen neuen Überprüfungsprozess definiert: Wie sehen Sie, ob Personen tatsächlich Qualitätsstandards oder Richtlinien befolgen? Wie können Sie messen, ob sich die Texte nach dem neuen Training verbessern? Und welche Teile der Dokumente haben sich seit langem nicht geändert, obwohl sie es wahrscheinlich hätten tun sollen?

Mit Text Analytics können Sie viele und lange Dokumente im Laufe der Zeit auf ihre Qualitätsentwicklung überprüfen. Wenn Sie für die Qualität dieser schwarzen Löcher verantwortlich sind, könnte Text Analytics ein Ansatz sein, wie Sie jetzt das Lenkrad wieder übernehmen.

Trendanalyse im Qualicen Scout

Screenshot: Der Qualicen Scout zeigt eine Trendanalyse der Qualität einer Testsuite eines unserer Kunden. Es begann mit einem ziemlich schlechten Trend (mehr Ergebnisse) am Anfang, aber es verbesserte sich messbar und sichtbar im Laufe der Zeit. “Gut gemacht!”, kann man hier Team und Management objektiv messbar aufzeigen.

Anwendungsfall 4: Extrahieren von Wert aus dem Chaos für Textnutzer

Last but not least: Warum lesen Sie normalerweise Texte? Natürlich, um Wert zu gewinnen, um Wissen zu extrahieren und daraus etwas Neues zu schaffen! Zum Beispiel nehmen Tester eine Anforderung und erstellen mit ein bisschen Magie daraus Modelle und Testfälle (eine ausführlichere Erklärung finden Sie in diesem Blogbeitrag). Denken Sie mal drüber nach: Bei vielen unserer täglichen Aufgaben geht es im Kern um eine relative simple oder mechanische Verarbeitung (wenn wir mal ganz ehrlich zu uns selbst sind). Text Analytics kann uns dabei helfen, bestimmte Informationen, Kenntnisse und damit den Wert eines Textes zu extrahieren und zu verwenden. Darüber hinaus können wir Text in andere Sprachen, in strukturierte Darstellungen (z. B. Modelle) oder in andere Textformen, z. B. Testfälle, übersetzen.

Ursache-Wirkungs-Diagramm in Specmate

Screenshot: Mit dem kostenlosen Open-Source-Tool Specmate können Ursache-Wirkungs-Diagramme aus natürlicher Sprache extrahiert werden. Der Clou: Sobald Sie diese Ursache-Wirkungs-Diagramme haben, können Sie Testfälle vollautomatisch generieren!

Text Analytics hat sich zu einem unglaublich leistungsstarken Tool entwickelt

Wow, das sind wirklich mehr Anwendungen als ich dachte, als ich anfing, diesen Artikel zu schreiben. Zu viele, um sich zu erinnern. Okay, fassen wir nochmal zusammen:

  • Der Schreiber: Text Analytics unterstützt Textersteller objektiv direkt beim Schreiben.
  • Der Leser: Text Analytics bringt Licht ins Dunkel.
  • Der Qualitätsmanager oder Vorgesetzte: Text Analytics hilft bei der Qualitätssicherung, wenn der Text nicht mehr überschaubar ist.
  • Der Nutzer des Textes: Text Analytics ermöglicht es den Wert aus dem Chaos zu extrahieren.

So viele Anwendungen. Ich habe wahrscheinlich einige vergessen, also lassen Sie es mich in den Kommentaren wissen. Und da Sie es hierher geschafft haben, fragen Sie sich wohl, ob Text Analytics für Sie funktionieren könnte? Gerne sage ich Ihnen ganz ehrlich meine Meinung und unterstütze Sie auch mit meinem Team. Schreiben Sie mir an henning.femmer@qualicen.de.

 

Hinweise:

Interessieren Sie sich für weitere Tipps aus der Praxis? Testen Sie unseren wöchentlichen Newsletter mit interessanten Beiträgen, Downloads, Empfehlungen und aktuellem Wissen.

[1] Hier finden Sie Informationen zu IBM Watson.
[2] Hier finden Sie Informationen zu ELMo.
[3] Hier finden Sie Informationen zu BERT.

Dr. Henning Femmer
Dr. Henning Femmer

Dr. Henning Femmer ist einer der Gründer von Qualicen. Hier hilft er unterschiedlichsten Firmen bei der Einführung von Text Analytics-Ansätzen.

Herr Dr. Femmer hat an der Technischen Universität München im Bereich Software Engineering promoviert. Unter anderem ist er im Steering Committee des Artificial Intelligence for Requirements Engineering Workshops und häufig als Speaker auf nationalen und internationalen Konferenzen tätig.