Einleitung
Die Automatisierung von Dokumenten-Workflows steht durch den Einsatz von Large Language Models (LLMs) und Künstlicher Intelligenz (KI) vor einer Revolution. Moderne Technologien, insbesondere KI-Agenten und Intelligent Document Processing (IDP), ermöglichen es Unternehmen, Durchlaufzeiten zu reduzieren oder Fehlerquoten zu minimieren.
Warum Automatisierung jetzt einen neuen Stellenwert hat
Obwohl die Automatisierung in vielen Bereichen bereits weit fortgeschritten ist, bietet die Nutzung von KI in Form von LLMs oder darauf basierenden Lösungen ein enormes zusätzliches Potenzial. KI ermöglicht es, Dokumente und unstrukturierte Daten deutlich besser nutzbar zu machen und damit auch den Automatisierungsgrad zu erhöhen. Wir bekommen dadurch neue Möglichkeiten, Schritte oder ganze Prozesse zu automatisieren, wo wir bisher nur eingeschränkte Möglichkeiten hatten, darauf zu reagieren.
Die Treiber für diese Entwicklung sind vielfältig:
- Hohe Kosten aufgrund manueller Bearbeitung, die Aufwand und Durchlaufzeit im Prozess bedeuten und zu Engpässen führen können, besonders bei hohen Volumina zu Spitzenzeiten.
- Risiken, die durch manuelle Übertragungsfehler entstehen, welche sich negativ auf nachgelagerte Prozesse wie die Reklamationsbearbeitung oder den Kundenservice auswirken.
Die drei Stufen der Prozessautomatisierung
Um die Rolle von IDP und KI-Agenten zu verstehen, ist es hilfreich, die unterschiedlichen Automatisierungsansätze zu differenzieren:
- Klassische Automatisierung Diese passiert regelbasiert, wobei Prozesse deterministisch beschrieben werden. Der Weg von A nach B ist programmatisch klar definiert, oft durch Wenn-Dann-Abzweigungen. Die Logik wird dabei vom Anwender oder Administrator definiert.
- KI-gestützte Automatisierung (Intelligent Document Processing) Der Weg von A nach B ist weiterhin beschrieben, aber einzelne Schritte sind durch die Einbettung von KI-Modellen oder Diensten automatisiert. Hier werden Machine Learning Modelle oder Bildverarbeitung genutzt, um zum Beispiel Dokumentenprozesse besser zu automatisieren, wie bei der automatischen Ersteinschätzung eines Schadensfalls. Die Rolle des Mitarbeiters besteht in der Überwachung und Validierung der Ergebnisse.
- Agentische Automatisierung Im Gegensatz zu den ersten beiden Stufen wird hier lediglich das Ziel definiert. Die KI-Agenten sind technologisch in der Lage, eigenständig zu planen, welche Schritte notwendig sind, um das Ziel zu erreichen, und führen diese autonom aus. Der Mensch definiert die Ziele und die Rahmenbedingungen (mittels Prompting), innerhalb derer der Agent den optimalen Weg sucht.
Die KI-gestützte Automatisierung ist ein perfektes Beispiel für das Intelligent Document Processing, während KI-Agenten ein Beispiel für die agentische Automatisierung sind.
Intelligent Document Processing: Der Motor für strukturierte Daten
IDP ist kein völlig neues Thema. Konzepte wie OCR und Input Management gibt es seit vielen Jahren. Was neu ist, ist die KI-Unterstützung im IDP, die zu deutlich besseren Erkennungsergebnissen und flexibleren Modellen führt, die besser auf unterschiedliche Inputs reagieren können.
Im IDP erfolgt die Erkennung von Dokumentenklassen (z. B. Bestellung, Beschwerde, Reklamation) und die Extraktion relevanter Daten nicht mehr regelbasiert. Durch die Nutzung von LLMs ist das System nun deutlich flexibler. Unstrukturierte Daten – Dokumente, Bilder, Kommunikation – werden durch IDP in strukturierte, maschinenlesbare Daten umgewandelt. Diese strukturierten Daten sind die Basis für nachfolgende Prozesse, die dadurch weiter automatisiert werden können.
Die Rolle der KI-Agenten in der Entscheidungsautomatisierung
KI-Agenten verstehen Aufgaben, planen eigenständig die Schritte und führen sie autonom aus. Sie sind eine enorme Erweiterung für die Automatisierung von Entscheidungen, die nicht eindeutig anhand fester Regelwerke definiert werden können.
Ein KI-Agent kann die von IDP bereitgestellten strukturierten Daten nutzen, um automatisch passende Aktionen abzuleiten, Fälle nach Dringlichkeit zu priorisieren und das Ganze weiter voranzubringen. Dabei greift der KI-Agent auf ein generisches LLM zurück und kann gleichzeitig kontextbezogen weiteren Input aus anderen Systemen (wie dem Order System oder einem CRM System) hinzuziehen, um Anfragen zielgerichtet zu beantworten.
IDP und Agenten in der Praxis: Schadenfallbearbeitung
Ein praktisches Beispiel für den kombinierten Einsatz ist die automatisierte Schadensfallbearbeitung bei einem mittelständischen privaten Krankenversicherer. Ziel war eine enorme Reduktion der Bearbeitungszeit und Aufwände durch eine agentische Poststelle mit vollständiger KI-Unterstützung.
- Dokumentenverarbeitung und Konfiguration
Die Definition von Dokumentenklassen und die Extraktion relevanter Daten ist KI-gestützt, was den früher aufwendigen Anlernprozess vereinfacht. Die Klassifizierung und Extraktion funktioniert über natürliche Sprache (Prompting) und erfordert keine besondere Syntax. Das System kann Dokumente anhand der Klassendefinition automatisch trennen und klassifizieren, auch wenn sie als mehrseitige PDF ankommen, indem es den inhaltsbasierten Zusammenhang erkennt. - Flexible Erkennung
Das System kann nicht nur gedruckte Texte, sondern auch Handschriften erkennen, solange die Schrift nicht zu kryptisch ist und ein Mensch noch mitkommen würde. Die KI ist auch sprachunabhängig; so kann ein in Spanisch verfasstes Dokument verarbeitet werden, obwohl die Felddefinitionen in Englisch vorliegen. - Agenten-Logik
KI-Agenten werden erstellt, indem ihnen Anweisungen (Instruktionen) und Beschreibungen übergeben werden, um sicherzustellen, dass sie sich gemäß den unternehmensinternen Richtlinien verhalten. Der Agent nutzt dabei die Eingaben von Dokumenten und die entsprechenden Richtlinien, um das Routing und die Priorisierung der Dokumente festzulegen. - Entscheidungsunterstützung
Der Agent liefert dem Anwender eine Zusammenfassung des Inhalts und schlägt nächste Schritte und Empfehlungen vor, beispielsweise die Qualifizierung für eine 90-prozentige Erstattung. Dabei ist das sogenannte Reasoning (die Begründung der KI-Entscheidung) ein wichtiger Punkt, um die Nachvollziehbarkeit zu gewährleisten und Halluzinationen zu minimieren. - Wissensnutzung
Neben der Verarbeitung eingehender Dokumente können Unternehmen auch Knowledge Discovery (Experten-Chatfunktionen) nutzen. Diese greifen auf das vorhandene Unternehmenswissen (bestehende Dokumente und Vorgänge) zurück, um gezielte Fragen zu beantworten, zum Beispiel, bei welchen medizinischen Eingriffen der Arztbrief zur Notwendigkeit häufig vergessen wurde.
Fazit
Das Zusammenspiel von IDP und KI-Agenten eröffnet neue Möglichkeiten für die Prozessautomatisierung, wo wir bisher nur eingeschränkte Möglichkeiten hatten, darauf zu reagieren. Die wichtigsten Erkenntnisse aus dem aktuellen Stand der Technik sind:
- Verständnis schaffen: Es ist essenziell, IDP und auch Agenten zu verstehen, um zu beurteilen, welche Anwendungsfälle relevant sind und wo bereits erfolgreiche Umsetzungen existieren.
- „KI First“-Strategie: Unternehmen sollten bei Beschaffung und Evaluation ein Augenmerk auf KI-First-Lösungen legen, da die Entwicklung hier noch lange nicht abgeschlossen ist.
- Messen und Überwachen: Um den Erfolg sicherzustellen, ist es notwendig, von Beginn an klare KPIs festzulegen, anhand derer die Ergebnisse gemessen und kontrolliert werden.
Obwohl IDP und Agenten moderne und nützliche Technologien sind, gilt: Nicht auf jede Frage ist die Antwort, dass man einen Agenten benötigt – es gibt weiterhin viele klassische Automatisierungsfälle.
FAQ: Häufige Fragen
- Die Handschrifterkennung funktioniert inzwischen gut, allerdings nur bis zu einem gewissen Punkt, bis zu dem auch ein Mensch noch mitkommt, d.h. solange die Schrift nicht zu kryptisch wird.
- Antwort zum Layout: Der große Vorteil der Nutzung von LLM im Hintergrund ist die deutlich größere Flexibilität, da man nicht mehr die klassische Input-Management-Variante mit regelbasiertem Suchen (z. B. „Such nach Rechnung und schau rechts davon“) benötigt. Das System ist selbstlernend und effizienter in der Erkennung.
- Nein, das händische Hochladen wurde lediglich für den Test gemacht, um zu sehen, ob die Konfiguration (Anlegen einer Klasse und Datenextraktion) an Beispieldokumenten funktioniert.
- Automatisierung: Normalerweise erfolgen entsprechende Übergaben durch APIs, Schnittstellen und andere Technologien, wodurch die Dokumente automatisch in den Prozess importiert werden und Trennung, Klassifikation sowie Extraktion im Hintergrund stattfinden.
- Das LLM und die KI ermöglichen es, den Zusammenhang der Dokumente automatisch zu erkennen. Es findet eine inhaltsbasierte Erkennung des Zusammenhangs statt, d.h. es wird erkannt, wo ein Dokument anfängt und endet.
- Die Kundenstammdaten auf der ersten Seite spielen dabei zunächst keine Rolle.
- Das LLM analysiert das Dokument und prüft dann anhand der definierten Klassen, ob auf der Folgeseite eine der möglichen Klassen identifiziert wurde. Die Trennung erfolgt dann über das Scoring (Konfidenzwerte) des Systems basierend auf den definierten Klassen.
- LLM-Nutzung: Bei IDP wird ein Standard-LLM verwendet (von Anthropic), das nicht geändert werden kann, da es die besten Ergebnisse für den Anwendungsfall liefert. Bei den KI-Agenten besteht eine Auswahlmöglichkeit von verschiedenen LLMs.
- Datenhoheit/Lernen: Die Privatsphäre, Datensicherheit und Hoheit über Ihre Daten bleibt beim Nutzer. Es werden außer dessen, was der Kunde im Mandanten macht, keine Daten zum Lernen oder Training von LLMs verwendet.
- Integration: IDP kann an verschiedenen Punkten zum Einsatz kommen, z. B. im vorgelagerten Prozess (Posteingang, Bilder über eine App) oder im Laufe eines Workflows, um an einzelnen Punkten unstrukturierte Daten (z.B. ein Bild) an IDP zu senden und die Ergebnisse in den Prozess zurückzuholen.
- API-Nutzung: Die Funktionalitäten von IDP können API-betrieben genutzt werden. Die eigentliche Nutzung und Einbindung ist über den Schnittstellenzugriff sehr flexibel.
- Oberflächen: Die administrativen Aufgaben, wie die Konfigurationen und das Anlernen, sind in den Oberflächen verankert.
- Datenhoheit und Lernen: Es wird garantiert, dass die Daten nicht geteilt oder für das Training oder Lernen verwendet werden, es sei denn, der Nutzer hat dies spezifisch vorgesehen.
- Verarbeitung: Die Daten werden für die Verarbeitung nicht persistiert. Nachdem die Daten vom LLM zurückgegeben wurden, werden sie sofort gelöscht, wodurch das System als reine Datenverarbeitung genutzt werden kann, wobei die extrahierten Daten an das Zielsystem übergeben werden und nichts weiter gespeichert wird.
- Regulierte Umfelder: In regulierten Umfeldern besteht die Möglichkeit, ein lokales Modul zu betreiben und dieses zu adressieren, um den Datenzugriff noch stärker zu kapseln.
- Ja, Absprünge ins SAP sind möglich. SAP-Daten wie Stammdaten und Auftragsdaten sind für den Kontext eines Agenten von Interesse.
- Integration: Man kann IDP oder den Agenten an SAP andocken und den Agenten nutzen, um bestimmte Flags oder Meilensteine zu setzen. Es können SAP-Konnektoren genutzt werden, um in einem gewissen Scope Anpassungen vorzunehmen oder zum Beispiel Items zu erstellen.
- Es ist beides möglich. Sie können entscheiden, ob Sie die Extraktion der Daten auf Basis des OCR-Extrakts oder auf Basis des Bildes (Foss des Dokuments) wünschen.
- Bilder und Grafiken: Wenn Bilder, Diagramme oder Grafiken vorliegen, kann das Bild des Dokuments verarbeitet werden. Man kann das LLM verwenden, um sich das Bild (z. B. ein Schadensbild) beschreiben zu lassen, um den Inhalt des Bildes mit der Eingabe des Kunden zu vergleichen und so auf Plausibilität zu prüfen. Diese bildbasierte Verarbeitung ermöglicht ganz andere Anwendungsfälle, als nur das OCR-Extrakt zu sehen.
On-demand Webinar
KI-Agenten und IDP: Die Zukunft intelligenter Dokumentenprozesse
Manuelle Dokumentenbearbeitung ist zeitaufwendig, fehleranfällig und teuer. In unserem kostenlosen Webinar zeigen wir Ihnen, wie Sie mit Intelligent Document Processing (IDP) und KI-Agenten Ihre Workflows automatisieren und Ihre Bearbeitungszeiten um bis zu 50 % reduzieren – ohne Qualitätseinbußen.