KI in Prozesse einbinden: Warum Architektur wichtiger ist als die Modellwahl 

Inhalt

Der Uber-Fall zeigt, was Skalierung wirklich kostet

Ein großer Tech-Konzern mit Tausenden Ingenieuren, gewachsener KI-Erfahrung und erheblichem Budget verliert die Kontrolle über seine KI-Ausgaben. Auf den ersten Blick klingt das wie ein Sonderfall. Bei genauerem Hinsehen zeigt sich jedoch ein Muster, das viele Unternehmen betrifft, sobald KI nicht mehr nur in einzelnen Pilotprojekten genutzt wird. 

Uber soll innerhalb von vier Monaten das geplante Jahresbudget für KI-Werkzeuge verbraucht haben. Auslöser war nicht ein einzelnes fehlgeschlagenes Projekt, sondern die breite Nutzung von KI-gestützten Coding-Tools in der Organisation. Genau darin liegt die eigentliche Lehre: KI-Kosten entstehen nicht nur durch Modellpreise. Sie entstehen durch Nutzung, Skalierung, fehlende Steuerung und durch Architekturen, die zu früh zu eng gebaut wurden. 

Gleichzeitig sinken die Kosten für KI massiv. Der Stanford AI Index 2025 zeigt, dass die Kosten für ein Modell auf GPT-3.5-Leistungsniveau von 20 US-Dollar pro Million Tokens im November 2022 auf 0,07 US-Dollar im Oktober 2024 gefallen sind. Das entspricht einer Reduktion um mehr als den Faktor 280. Trotzdem bleiben KI-Ausgaben in Unternehmen schwer planbar, wenn Nutzung unkontrolliert wächst und Prozesse direkt an einzelne Dienste gekoppelt werden. 

Der Engpass ist deshalb nicht mehr der Zugang zu KI. Der Engpass ist der strukturelle Umgang mit KI im Unternehmen. 

Die Modellfrage kommt oft zu früh

In vielen Projekten beginnt die Diskussion mit einer scheinbar naheliegenden Frage: Welches KI-Modell ist das richtige für diesen Use Case? 

Diese Frage ist berechtigt. Sie ist aber selten die erste Frage, die beantwortet werden sollte. Denn Modelle verändern sich schnell. Neue Varianten kommen auf den Markt, bestehende Modelle werden günstiger, kleinere Modelle werden leistungsfähiger und Betriebsmodelle verschieben sich zwischen Cloud, Private Cloud und On-Premise. 

Wenn eine Fachanwendung bzw. ein Prozess direkt an ein konkretes Modell angebunden wird, entsteht früh eine technische Abhängigkeit. Ein Workflow ruft dann zum Beispiel unmittelbar eine bestimmte API auf. Das funktioniert in der ersten Umsetzung oft schnell und pragmatisch. Spätestens beim nächsten Modellwechsel, bei einer Kostenoptimierung oder bei neuen Governance-Anforderungen wird diese Abkürzung jedoch teuer. 

Die wichtigere Architekturfrage lautet daher: Wie binden wir KI so ein, dass Fachanwendungen und Prozesse stabil bleiben, auch wenn sich Modelle, Anbieter oder Betriebsformen ändern? 

„Der Engpass ist nicht mehr der Zugang zu KI. Der Engpass ist der strukturelle Umgang mit KI im Unternehmen.“

Modellwechsel wird zum Normalfall

Der KI-Markt entwickelt sich nicht linear. Foundation Models, spezialisierte Modelle, Open-Source-Modelle und kleinere Sprachmodelle entstehen in hoher Frequenz. Parallel dazu verändern sich die wirtschaftlichen Rahmenbedingungen. Was heute als leistungsfähig und bezahlbar gilt, kann in wenigen Monaten überholt sein. 

Für Unternehmen bedeutet das: Eine Architektur, die auf wenige Large Language Models ausgerichtet ist, passt immer seltener zur Realität. In der Praxis werden verschiedene Modelle für verschiedene Aufgaben eingesetzt. Ein leistungsstarkes Large Language Model kann für komplexe Analyse- oder Dialogszenarien sinnvoll sein. Für Klassifikation, einfache Extraktion oder standardisierte Zusammenfassungen reicht häufig ein kleineres oder spezialisiertes Modell. 

Diese Differenzierung ist wirtschaftlich relevant. Wer jede Aufgabe mit dem leistungsstärksten verfügbaren Modell löst, zahlt häufig zu viel. Wer dagegen je Anwendungsfall entscheiden kann, welches Modell fachlich ausreicht und wirtschaftlich sinnvoll ist, gewinnt Steuerungsfähigkeit. 

Dafür braucht es eine Architektur, die Modellwechsel nicht als Ausnahme behandelt, sondern als normalen Betriebszustand. 

0 %

Laut McKinsey-Report „Superagency in the workplace“ planen 92 % der befragten Unternehmen, ihre Investitionen in KI in den kommenden drei Jahren zu erhöhen.

Laut dem „AI Index Report 2025“ des Stanford Institute for Human-Centered Artificial Intelligence sind die Inferenzkosten für ein KI-System auf GPT-3.5-Niveau zwischen November 2022 und Oktober 2024 um mehr als das 280-fache gesunken.

0 x

Shadow AI entsteht dort, wo Struktur fehlt

Neben der Modellwahl zeigt sich in vielen Unternehmen ein zweites Muster. Fachbereiche starten eigene KI-Initiativen, weil der Bedarf real ist und die Einstiegshürden niedrig sind. Ein Team automatisiert E-Mails, ein anderes analysiert Dokumente, ein drittes baut einen Assistenten für interne Auskünfte. 

Das ist verständlich. Es zeigt, dass die Fachbereiche konkrete Potenziale sehen. Problematisch wird es, wenn jede Initiative ihre eigene technische Lösung, eigene Zugänge, eigene Prompts, eigene Datenflüsse und eigene Governance-Regeln mitbringt. 

Dann entsteht keine skalierbare KI-Nutzung, sondern eine Landschaft aus Einzellösungen. Wiederverwendung findet kaum statt. Kosten lassen sich schwer zuordnen. Qualitäts- und Freigabeprozesse bleiben uneinheitlich. Auch Human-in-the-Loop-Konzepte, Protokollierung und Auditierbarkeit lassen sich auf diese Weise nur schwer übergreifend etablieren. 

Shadow AI ist deshalb nicht nur ein Compliance-Thema. Es ist vor allem ein Architekturthema. Wenn Unternehmen keine gemeinsamen Strukturen anbieten, entstehen dezentrale Lösungen fast zwangsläufig. 

Der AI Service Layer entkoppelt Prozess und Modell

Ein tragfähiger Ansatz ist eine Abstraktionsschicht zwischen Fachprozessen und KI-Infrastruktur. Diese Schicht kann als AI Service Layer oder Capability Layer verstanden werden. 

Der Grundgedanke ist einfach: Fachprozesse rufen nicht direkt ein bestimmtes Modell bei einem bestimmten Anbieter auf. Sie greifen auf definierte KI-Fähigkeiten zu. Dazu gehören zum Beispiel Klassifikation, Extraktion, Zusammenfassung, semantische Suche oder Entscheidungsunterstützung. 

Welche technische Komponente diese Fähigkeit im Hintergrund bereitstellt, entscheidet nicht der Fachprozess. Das kann ein cloud-gehostetes Large Language Model sein, ein spezialisiertes Small Language Model, ein Open-Source-Modell in einer eigenen Umgebung oder eine Kombination mehrerer Dienste. 

Für den Prozess bleibt die Schnittstelle stabil. Für die IT entsteht die Möglichkeit, Modelle auszutauschen, Kosten zu optimieren, Zugriffe zentral zu steuern und Governance-Regeln konsistent durchzusetzen. 

Genau dieser Punkt ist entscheidend: Flexibilität entsteht nicht durch die Auswahl des vermeintlich besten Modells. Flexibilität entsteht durch die Fähigkeit, Modelle wechseln zu können, ohne Geschäftsprozesse umzubauen. 

In Fähigkeiten denken, nicht in Tools

Prozessbedarf
Direction Arrows
1
benötigte Fähigkeit
Direction Arrows
2
Qualitätsanforderung
Direction Arrows
3
Modellwahl
Direction Arrows
4
Betrieb & Governance
5

Der Wechsel zur Capability-Perspektive verändert die Diskussion. Statt zu fragen, welches Modell eingesetzt werden soll, wird zuerst geklärt, welche Fähigkeit ein Prozess benötigt. 

Ein Dokumentenprozess braucht zum Beispiel keine „KI“ im abstrakten Sinn. Er benötigt eine zuverlässige Klassifikation eingehender Dokumente, eine Extraktion relevanter Felder, eine Plausibilisierung der Ergebnisse und gegebenenfalls eine Übergabe an einen Menschen zur Prüfung. 

Diese Fähigkeiten lassen sich als wiederverwendbare Services bereitstellen. Einmal sauber implementiert, können sie in mehreren Prozessen genutzt werden. Das reduziert doppelte Entwicklung, erleichtert Qualitätssicherung und schafft eine gemeinsame Grundlage für Monitoring und Verbesserung. 

Ein Beispiel: In einem Dokumenteneingang sollen eingehende Unterlagen automatisch erkannt und relevante Daten für den nachgelagerten Fachprozess extrahiert werden. Ohne Capability Layer würde der Workflow direkt ein Modell ansprechen. Mit Capability Layer ruft der Prozess die Fähigkeit „Dokument klassifizieren“ und „Daten extrahieren“ ab. Welches Modell dahinterliegt, kann später angepasst werden. 

Der Prozess bleibt stabil. Die KI-Komponente bleibt austauschbar. 

Orchestrierung ist das Fundament

KI sollte nicht als separater Zusatz neben bestehenden Prozessen betrachtet werden. In der Praxis entsteht der Nutzen erst dann, wenn KI sinnvoll in Abläufe eingebunden wird: an der richtigen Stelle, mit den richtigen Daten, mit klaren Übergaben und mit definierter Verantwortung. 

Genau hier liegt die Rolle der Prozessorchestrierung. Sie verbindet Anwendungen, Daten, Entscheidungen und Aufgaben über Systemgrenzen hinweg. KI wird in diesem Bild zu einem weiteren Baustein in der Prozessarchitektur. 

Ein Workflow kann eine Klassifikation anstoßen, extrahierte Daten validieren, Ergebnisse an ein Fachsystem übergeben, eine manuelle Prüfung auslösen oder einen Folgeprozess starten. Die KI übernimmt dabei nicht den gesamten Prozess. Sie übernimmt eine klar abgegrenzte Fähigkeit innerhalb des Prozesses. 

Das ist ein wichtiger Unterschied. Wer KI isoliert einführt, erzeugt häufig Punkt-zu-Punkt-Integrationen. Wer KI orchestriert einbindet, schafft steuerbare Prozesslogik. 

In der Praxis haben sich dafür Werkzeuge bewährt, die technische Integration, Workflow-Logik und KI-Aufrufe zusammenbringen. n8n eignet sich beispielsweise für die Gestaltung flexibler KI-Workflows und die Bereitstellung wiederverwendbarer Capabilities. OpenRouter kann als Abstraktionsschicht helfen, Modellzugänge und API-Key-Management zentraler zu steuern. Entscheidend ist jedoch nicht das einzelne Tool, sondern das Architekturprinzip dahinter. 

Praxisbeispiel: Dokumentenklassifikation im Fachprozess

Ein typisches Szenario ist der digitale Dokumenteneingang. Eingehende Dokumente sollen automatisch klassifiziert, relevante Informationen extrahiert und anschließend an den passenden Fachprozess übergeben werden. 

Eine schnelle Umsetzung wäre möglich, indem der Prozess direkt eine externe KI-API aufruft. Für einen ersten Prototyp kann das ausreichen. Für den produktiven Betrieb entstehen jedoch mehrere Schwachstellen. Der Prozess hängt an einem konkreten Anbieter. Änderungen am Modell erfordern Eingriffe in den Workflow. Kosten lassen sich nur begrenzt je Fähigkeit oder Prozess auswerten. Governance-Regeln müssen an verschiedenen Stellen nachgezogen werden. 

Mit einem Capability Layer wird der Ablauf anders aufgebaut. Der Prozess ruft eine zentrale Klassifikations- und Extraktionsfähigkeit ab. Dort wird entschieden, welches Modell für den konkreten Dokumenttyp eingesetzt wird. Auch Regeln für Protokollierung, Freigabe, Qualitätssicherung und Human-in-the-Loop-Prüfung liegen an einer zentralen Stelle. 

Wenn später ein anderes Modell bessere Ergebnisse liefert oder die gleiche Qualität günstiger bereitstellt, kann die technische Umsetzung hinter der Capability angepasst werden. Der Fachprozess muss dafür nicht neu gebaut werden. 

Das ist der praktische Wert der Entkopplung: Sie reduziert nicht nur technische Abhängigkeiten, sondern verbessert auch die wirtschaftliche Steuerbarkeit.  

Governance braucht einen zentralen Ansatz

Governance wird bei KI häufig erst diskutiert, wenn Risiken sichtbar werden. Dann geht es um Datenschutz, Modellfreigaben, Protokollierung, Nachvollziehbarkeit, Kostenkontrolle oder die Frage, welche Daten an welchen Dienst übergeben werden dürfen. 

Diese Themen lassen sich schwer beherrschen, wenn jede Abteilung eigene KI-Verbindungen aufbaut. Ein zentraler AI Service Layer schafft dagegen einen Ort, an dem Governance technisch und organisatorisch verankert werden kann. 

Dazu gehören zum Beispiel: 

Damit wird Governance nicht zum Bremsklotz, sondern zur Voraussetzung für Skalierung. Unternehmen können Fachbereiche schneller befähigen, weil die grundlegenden Leitplanken bereits vorhanden sind. 

Orchestration First als Designprinzip

Die wichtigste Empfehlung lautet: Orchestration First. 

Das bedeutet nicht, Modellqualität zu ignorieren. Es bedeutet, die Modellwahl in eine belastbare Prozess- und Integrationsarchitektur einzubetten. KI sollte nicht direkt in einzelne Workflows verdrahtet werden, sondern als wiederverwendbare Fähigkeit verfügbar sein. 

Dieser Ansatz schafft drei Vorteile:

Erstens bleiben Geschäftsprozesse stabil, auch wenn sich Modelle oder Anbieter ändern.

Zweitens können Kosten je Anwendungsfall optimiert werden, statt pauschal das leistungsstärkste Modell einzusetzen.

Drittens lässt sich Governance zentraler umsetzen, weil Zugriffe, Freigaben und Protokollierung nicht über viele Einzellösungen verteilt sind.

Unternehmen, die KI produktiv und dauerhaft nutzen wollen, sollten deshalb nicht nur über Modelle sprechen. Sie sollten über Prozessarchitektur, Capabilities, Betriebsmodelle und Steuerbarkeit sprechen. 

Denn der eigentliche Unterschied entsteht nicht bei der Frage, welches Modell heute am besten ist. Er entsteht bei der Frage, ob die eigene Architektur auch morgen noch handlungsfähig bleibt. 

FAQ

Ein AI Service Layer ist eine Abstraktionsschicht zwischen Geschäftsprozessen und KI-Modellen. Prozesse greifen dabei nicht direkt auf ein bestimmtes Modell zu, sondern auf definierte Fähigkeiten wie Klassifikation, Extraktion oder Zusammenfassung.

Direkte Modellkopplung macht Prozesse abhängig von einem konkreten Anbieter, Modell oder API-Design. Wenn später ein anderes Modell genutzt werden soll, muss häufig der Prozess selbst angepasst werden.

Ein Capability Layer stellt wiederverwendbare KI-Fähigkeiten bereit. Dadurch können mehrere Prozesse dieselbe Funktion nutzen, ohne jeweils eigene Modellanbindungen, Prompts oder Integrationslogiken aufzubauen.

Ein kleineres oder spezialisiertes Modell kann sinnvoll sein, wenn die Aufgabe klar abgegrenzt ist, etwa bei Klassifikation, Extraktion oder standardisierten Zusammenfassungen. Entscheidend ist nicht die Modellgröße, sondern die passende Qualität für die jeweilige Capability.

Orchestrierung sorgt dafür, dass KI nicht isoliert eingesetzt wird, sondern als Bestandteil eines Geschäftsprozesses. Sie steuert Datenflüsse, Aufgaben, Entscheidungen, Systemübergaben und menschliche Prüfungen.

KI in der Prozessautomatisierung Vol. 2:
KI-Workflows in der Praxis

Webinar am 9. Juli 2026, 10:00 - 10:30 Uhr

Viele Unternehmen haben erste KI-Prototypen umgesetzt – doch der eigentliche Mehrwert entsteht erst im produktiven Prozess. In diesem Webinar zeigen wir, wie KI-Funktionen zuverlässig in bestehende Workflows integriert werden: mit klarer Prozesslogik, Human-in-the-Loop, Governance und Fallbacks für unsichere Ergebnisse.

 

Sie erfahren, wie aus einzelnen KI-Ideen belastbare Prozesse werden und wie klassische Workflow-Automatisierung und KI sinnvoll zusammenspielen. Live dabei sein lohnt sich: Stellen Sie Ihre Fragen direkt und erhalten Sie im Nachgang Aufzeichnung, Folien und Q&A.