Zurück
KI-Corner 12/20
Dokumente mit mehr Tiefgang
Sparkassen produzieren tagtäglich eine Vielzahl von Dokumenten. Dokumentenmanagementsysteme (DMS) können in Verbindung mit Künstlicher Intelligenz helfen, ein effizientes Wissensmanagement aufzubauen.

Die heutige Wirtschaft wird zunehmend digitaler. Sparkassen und Finanzdienstleister müssen deshalb Informationen effizienter erfassen und verarbeiten. Wissen im Unternehmen zu organisieren und es transparent für alle Beteiligten leicht zugänglich zu machen, ist zunehmend ein wesentlicher Wettbewerbsvorteil.

Prozessrelevante Informationen müssen ebenso festgehalten werden wie reine Daten – vor allem vor dem Hintergrund einer immer stärkeren digitalen Vernetzung der Sparkassen mit ihren Kunden. Mit dem Elektronischen Safe können die Sparkassenkunden die digitalen Dokumente strukturiert, einfach und sicher verwalten.

Die innovative Cloud-Lösung ist ein wesentliches Element der Digitalisierungsstrategie der Sparkassen und bietet zahlreiche Möglichkeiten zur Entwicklung weiterer Mehrwertdienste. Sukzessiv entwickelt sich der Elektronische Safe zum zentralen digitalen Tresor für den Kunden und zugleich zu einer neuen Kundenschnittstelle.

Elementare Inhalte herausfiltern

Die Unternehmen stehen vor der Aufgabe, aus der Masse an Informationen, die über die verschiedensten Kanäle (Post, E-Mail, Internet etc.) täglich in die Organisationen gelangen, die für sie elementaren Inhalte effizient und möglichst genau herauszufiltern sowie diese innerhalb kürzester Frist an die entsprechenden Bearbeiter oder Folgeprozesse zu übergeben.

Zwar haben sich die Kanäle der Informationsvermittlung über die Jahre verändert und verlagert – E-Mail und Internet sind wichtiger geworden –, aber ein großer Teil des Dokumentenaustauschs erfolgt noch immer über den traditionellen Postweg.

Das exponentielle Wachstum von Informationen und die Notwendigkeit, deren zunehmende Komplexität zu verwalten, lässt sich allein mit konventionellen DMS-Technologien nicht mehr unter den Anforderungen an ein einfaches und effektives Information Retrieval unterstützen.

Die informationstechnologische Unterstützung strategischer, dispositiver und operativer Aufgabenstellungen berücksichtigt vermehrt unstrukturierte Informationsquellen. Dies zeigt sich insbesondere anhand der unterschiedlichen Verdichtungsstufen der Daten in den Zeitreihen und den unterschiedlichen Informationsquellen (E-Mail, Tabellen, Präsentationen, externe Berichte etc.).

Deskriptive Informationsmodelle, die auf Enterprise-Resource-Planning (ERP), Customer-Relationship-Management (CRM) oder externer Marktforschung basieren, sind zunehmend ineffektiv, weil sie mit Daten und Beobachtungen aus der Vergangenheit arbeiten und ihnen die Daten aus unstrukturierten Quellen fehlen wie:

  • intern: Kommunikations-, Kollaborations- und Dokumentenmanagementsysteme einschließlich E-Mails, Textdateien, Word-Dokumente, Präsentationen
  • extern: Informationsströme, Berichte und soziale Medien.

Die Berücksichtigung unstrukturierter Daten, die in Text-, Bild- oder Sprachformaten vorliegen und damit nicht ohne weiteres verarbeitbar sind, neben konventionellen Finanz- und Wirtschaftsdaten verbessert die Qualität der abgeleiteten Ergebnisse.

KI und maschinelles Lernen (ML) sind dabei die zentralen Schlüsseltechnologien, um solche Datenformate zu verarbeiten. Strukturierte und unstrukturierten Informationsquellen zu nutzen, ist zugleich das Fundament für ein effektives Informations- und Wissensmanagement.

Klassifizierung und Verarbeitung automatisieren

Künstliche Intelligenz verbessert die Klassifizierung und Verknüpfung von Dokumenten.

Die Klassifizierung großer Mengen unstrukturierter Dokumente in eine entsprechende vordefinierte Ablagestruktur (z. B. die automatische Einsortierung unterschiedlichster Dokumententypen einer Finanzierung) ist eine typische Anwendungsdomäne von KI. Klassifikationslösungen können Dokumente automatisch dem richtigen Thema oder einer bestimmten Kategorie zuzuordnen.

Dafür wird ein Metadatum (z. B. ein bestimmtes Thema) zu einem beliebigen Textfragment erzeugt und das Dokument wird anschließend auf Grundlage seines Inhalts diesem Thema zugewiesen. Mit zunehmender Anzahl der mit KI verarbeiteten Dokumente erhöht sich die Qualität bei der Identifizierung und der Verarbeitung der in den Dokumenten enthaltenen Informationen.

Das zugrundeliegende Prinzip des maschinellen Lernens basiert auf statistischen Verfahren, die sowohl Näherungen als auch Fehlertoleranzen berücksichtigen. Dabei erkennen Neuronen Linien, Formen oder Texturen, sodass anhand der erlernten Merkmale eine Datenklassifizierung möglich wird.

Bei der Objekterkennung lassen sich etwa folgende Bereiche unterscheiden:

  • Klassifizierung: Zu welcher definierten Gruppe gehört ein Objekt?
  • Lokalisierung: Wo auf dem Bild befindet sich das zuvor definierte Objekt?
  • Sortierung: Welche Bilder weichen von einem bestimmten Muster ab?
  • Labeling: Welche Objekte werden auf dem Bild erkannt?

Extraktion von Daten

Für Hypotheken hat Google mit Lending DocAI eine neuartige KI-Anwendung entwickelt.

Ein KI-gestütztes DMS kann Informationen, die derzeit in einzelnen Dokumenten verborgen sind, genauer und schneller extrahieren. Mit Google DocAI können Unternehmen etwa Daten aus Formularen, Dokumenten und Verträgen aufnehmen und Schlüssel-Werte-Paare und Entitäten zu extrahieren (Google 2020a). Im Video gibt es weitere Erläuterungen der Technologie (in Englisch).

Ein Google-AI-Anwendung für den Geschäftsbereich Hypotheken ist zum Beispiel Lending DocAI (Google 2020b). Damit können Kreditinstitute Arbeitsabläufe bei Hypotheken beschleunigen, sodass Darlehen einfach verarbeitet und die Dokumentdatenerfassung und -prüfung automatisiert erfolgt. Ein weiterer Vorteil betrifft Qualität und Aktualität der im System verwendeten Dokumente (z. B. Steuerbescheide und Anlagenbelege).

Gruppierung von Dokumenten

In den meisten Unternehmen gibt es nach wie vor zahlreiche Aktenbestände in Papierform, die seit Jahren sukzessive digitalisiert werden. Im Normalfall werden diese eingescannt und in Systemen mit starren Ordner- und Ablagestrukturen abgelegt.

Dieser Vorgang ist für Unternehmen mit hohen Kosten und zahlreichen Arbeitsstunden verbunden. Trotzdem bleibt weiterhin viel Potential zur Auswertung ungenutzt, weil die klassischen Datenstrukturen eine Transformation zu einer datengetriebenen Sicht nur unzureichend unterstützen.

Verknüpfungen über Stammdaten bleiben verborgen, automatische Reports werden nur rudimentär unterstützt. Für Anwender sind solche Ablagesysteme oft nicht intuitiv verständlich und nutzerfreundlich.

Darüber hinaus sind vorhandene Ordnerstrukturen teilweise mehrere Jahre alt, oft wenig gepflegt und bilden neue Standards und Logiken nur unzureichend ab. Durch das Einscannen werden aus analoge lediglich digitale Dokumente.

Eine KI kann den Dokumentenbestand eines Unternehmens automatisiert verschiedenen Themen oder Hierarchien zuordnen – was besonders hilfreich ist, wenn Themen und Hierarchien vorher nicht bekannt sind –, Beziehungen zwischen Dokumenten in einem breiteren Kontext verstehen, Schlussfolgerungen und Hypothesen bilden und Ähnlichkeiten zwischen Dokumenten entdecken. Das Ergebnis ist eine leichtere Kategorisierung, Organisation und Suche von Firmendokumenten.

Eine Anwendungssoftware ist unter anderem iManage RAVN zur Klassifizierung und Extrahierung von Dokumenten (iManage 2020). Durch das Verstehen und Organisieren von Daten und Informationen identifiziert und clustert das Programm auf der Grundlage von Ähnlichkeiten und Relevanz. Von dort aus kann RAVN sogar aussagekräftige Daten aus Verträgen, Finanzberichten und anderen Papierdokumenten extrahieren.

Datenextraktion und -analyse

Informationen automatisch „lesen“ zu können, hat einen weiteren wichtigen Nutzen. KI-Algorithmen können Datenpunkte oder wichtige Informationen aufnehmen und dokumentenübergreifend zusammenführen und so die Extraktion bestimmter Datensätze aus verschiedenen Dokumenten ermöglichen.

Dabei geht es nicht nur um den Inhalt der Dokumente, sondern auch um die Dokumente selbst. Sie können Informationen darüber erhalten, wie viele Dokumente jemand je nach Typ, Kunde usw. hat.

Unternehmen können auf diese Weise ihre eigene Dokumentverwendung und -statistik verfolgen und verändernde Muster und Trends erkennen. Von Vorteil ist ferner die Integration der KI-Lösung in die operativen Anwendungssysteme.

Die im Geschäftsverkehr verwendeten Dokumente haben meist eine einheitliche Struktur (Kopf- und Fusszeile, Logo etc.). Bei einer Aktualisierung dieser Inhalte, könnte eine KI-Anwendung anschließend die erforderlichen Änderungen an den Dokumentvorlagen automatisiert durchführen.

Technisch möglich ist auch, Workflows mit KI-Systemen zu koppeln. Dokumente können anhand von Workflows, die auf einfachen Regeln basieren, automatisch an die richtige Person oder Abteilung gesendet werden (z. B. automatisch mehrere Unterschriften für Zahlungsfreigaben oder Genehmigungen einzuholen). Es entstehen weniger Schnittstellen in Verbindung mit einer Reduzierung der Prozesslaufzeit.

KI verbessert die Customer Journey

KI führt Bankkunden durch Angebote und hilft bei Bedarf.

Der Austausch bzw. der Prozess und die Verarbeitung von Dokumenten haben einen direkten Einfluss auf die Customer Journey. Der Prozess – der Fluss von Ereignissen und Aktionen – ist der Ort, an dem Kundenerfahrung und -beteiligung erfolgt und der Kunde durch kürzere Bearbeitungszeiten eine wahrnehmbare Servicequalität und Zufriedenheit erfährt.

Kern der Dokumentenverarbeitung ist die Art und Weise, wie Dokumente lokalisiert, aufbereitet, identifiziert, klassifiziert und dann zur Datenextraktion, Validierung und Freigabe in die Prozesse und Systeme eingehen. Während die meisten Banken und Finanzdienstleister die Dokumenteneingabe über Smartphones und PDFs im E-Mail-Anhang weitgehend digitalisiert haben, findet die eigentliche Verarbeitung der Inhalte am Ende des Prozesses statt und nicht direkt an der Kundenschnittstelle.

Somit bleiben einmalige Kundenereignisse ungenutzt, indem sie die Verarbeitung der wertvollsten Inhalte, die ihre Kunden bereitstellen wie Ansprüche, Belege, Auszüge, Berichte, Rechnungen auf das Ende des Prozesses verschieben. Diese Zweiteilung anstelle einer vollständig integrierten Dokumentenverarbeitung verursacht zusätzlichen Aufwand und eine Verzögerung und führt zu Enttäuschung bzw. Verärgerung beim Kunden.

Der zielorientierte Einsatz von KI im gesamten Prozess der Dokumentenverarbeitung (end-to-end) kann dazu beitragen, das skizzierte Spannungsverhältnisses aufzulösen. Oft ist der Einsatz dieser Technologie nur auf ein „Plug-in“ für Automatisierungsprojekte beschränkt (z. B. in OCR-Projekten).

Die Umwandlung von Zeichen in einem Dokument in Daten ist elementar, aber das Verständnis des Kontexts, der Beziehungen, der Entitäten und der Absicht der extrahierten Daten ist das, was den eigentlichen Nutzen der Automatisierung ausmacht.

KI hat in all diesen Bereichen große Fortschritte gemacht – vor allem beim Erkennen und Verstehen des Kontexts, der für Entitäten, Absichten und die Rolle der Dokumente in der Customer Journey erforderlich ist. Die Chance für KI liegt darin, die End-to-End-Verarbeitung von Dokumenten – und nicht nur die Erkennung der Textschrittfunktion – als wesentlichen Teil der Customer Journey in den Fokus zu nehmen.

Fazit

Werden Dokumente besser digitalisiert, können Unternehmen und ihre Mitarbeiter sich stärker auf ihr Fachwissen konzentrieren. Dadurch lässt der Administrationsaufwand reduzieren und die Servicequalität gegenüber den Kunden erhöhen. Neue Technologien wie Blockchain werden ebenfalls immer öfter bei der Verifizierung, Sicherheit und Redundanz der Dokumentenverwaltung angewendet.

Das automatisierte maschinelle Lernen hat gegenüber dem herkömmlichen maschinellen Lernen zahlreiche Vorteile. Sowohl der zeitliche als auch der personelle Aufwand des maschinellen Lernens lässt sich reduzieren.

Es wird weniger spezifisches Know-how wie Programmier- und ML-Kenntnisse benötigt. Dadurch bleibt es nicht mehr nur Datenwissenschaftlern und Programmierern vorbehalten, eigene Machine-Learning-Systeme zu erstellen.

Literatur

  1. Google (2020a): cloud.google.com/document-ai/ (Zuletzt abgerufen: 07. Dezember 2020)
  2. Google (2020b): cloud.google.com/solutions/lending-doc-ai/ (Zuletzt abgerufen: 08. Dezember 2020)
  3. iManage (2020): imanage.com/product/artificial-intelligence/ (Zuletzt abgerufen: 07. Dezember 2020)

Autor
Prof. Dr. Dirk Neuhaus, MBA ist Professor für Informationssysteme in Finanzdienstleistungsunternehmen an der Hochschule für Finanzwirtschaft & Management in Bonn und forscht auf dem Gebiet der Künstlichen Intelligenz.

Prof. Dr. Dirk Neuhaus
– 18. Dezember 2020