Agentic AI

Agentic AI in der Praxis:
Ein Leitfaden jenseits des Hypes

Deloitte nennt es die Zukunft. Wir haben es bereits gebaut. So sieht Agentic AI wirklich in der Produktion aus.

"Ein KI-Agent, der in der Demo funktioniert, aber in der Produktion versagt, ist nur ein teurer Chatbot. Echter Agentic AI verändert, wie Ihr Unternehmen arbeitet."

Jede Woche erscheint ein neuer Artikel über KI-Agenten, die das Unternehmen revolutionieren. Die Beratungsfolien sind beeindruckend. Die Demos sind überzeugend. Wenn es aber darum geht, etwas zu liefern, das wirklich in der Produktion läuft, wird es still. Wir haben Produktionsagenten für Rechnungsverarbeitung, Kunden-Onboarding und Vertriebsautomatisierung gebaut. Das haben wir dabei gelernt.

Was "Agentic AI" wirklich bedeutet (und was nicht)

Ein KI-Agent ist ein System, das seine Umgebung wahrnimmt, Entscheidungen trifft, Aktionen ausführt und Ergebnisse beobachtet — in einer Schleife, ohne ständige menschliche Eingabe. Das ist die Definition. Die Realität ist differenzierter.

Was es IST: mehrstufige automatisierte Arbeitsabläufe mit echten Entscheidungsfähigkeiten. Systeme, die eine Situation bewerten, einen Pfad wählen, ein Werkzeug ausführen, das Ergebnis beobachten und entscheiden, was als Nächstes zu tun ist. Was es NICHT IST: ein Chatbot, ein einzelner API-Aufruf oder ChatGPT mit einem System-Prompt.

Es gibt drei sinnvolle Ebenen der Handlungsfähigkeit, und die richtige Wahl ist wichtiger als fast jede andere Architekturentscheidung:

Wann Agentic AI betriebswirtschaftlich sinnvoll ist

Der teuerste Fehler, den wir sehen: Unternehmen bauen Agenten für Anwendungsfälle, die diese nicht brauchen. Nicht jeder Prozess profitiert von agentischer Automatisierung. Hier ist ein praktisches Entscheidungsrahmenwerk:

Anwendungsfall Agentisch? Begründung
Kunden-Support FAQ Nein Einfache Abfrage, kein mehrstufiges Denken nötig
Komplexes Kunden-Onboarding Ja Mehrstufig, bedingte Logik, mehrere Systemintegrationen
Rechnungsverarbeitung Ja Extrahieren → prüfen → weiterleiten → buchen — 4+ Schritte
Content-Erstellung Nein Einschrittig, menschliche Prüfung ohnehin notwendig
Vertriebsrecherche + Outreach Ja Recherchieren → personalisieren → terminieren → nachfassen
Echtzeit-Datenanalyse Ja Abrufen → verarbeiten → interpretieren → alarmieren

Das Muster ist klar: Agentic AI rechtfertigt seinen Preis, wenn ein Prozess vier oder mehr aufeinanderfolgende Schritte hat, Verzweigungslogik beinhaltet und mehrere Systeme integriert. Wenn Ihr Prozess linear und einfach ist, verwenden Sie ein einfacheres Werkzeug.

Die 4 Kernkomponenten jedes KI-Agenten

Die Agentenarchitektur

Jeder Produktionsagent hat diese vier Teile: (1) Wahrnehmung — welche Daten sieht er? (2) Gedächtnis — woran erinnert er sich? (3) Denken — welches Modell entscheidet die nächste Aktion? (4) Handeln — was kann er in der Welt tatsächlich tun?

Wahrnehmung umfasst, auf welche Daten der Agent zugreifen kann. Strukturierte Eingaben kommen aus APIs und Datenbanken — sauber, abfragbar, zuverlässig. Unstrukturierte Eingaben — Dokumente, E-Mails, PDFs, Bilder — erfordern eine Vorverarbeitung, bevor das Modell darüber nachdenken kann. Die Qualität Ihrer Wahrnehmungsschicht bestimmt direkt die Qualität der Agenten-Entscheidungen.

Gedächtnis existiert auf zwei Ebenen. Kurzzeitgedächtnis ist der Konversationskontext: was in dieser Sitzung passiert ist, welche Werkzeuge aufgerufen wurden, welche Ergebnisse zurückgekommen sind. Langzeitgedächtnis nutzt Vektordatenbanken (Pinecone, Weaviate, pgvector), um Informationen sitzungsübergreifend zu speichern und abzurufen. Die meisten Produktionsagenten benötigen beides.

Denken ist das LLM im Kern des Agenten — Claude, GPT-4o oder ein selbst gehostetes Modell — das als Entscheidungsmaschine agiert. Es liest den aktuellen Zustand, konsultiert das Gedächtnis und entscheidet: welches Werkzeug als nächstes aufzurufen ist, wie ein Ergebnis zu interpretieren ist, wann an einen Menschen eskaliert werden soll.

Handeln ist das, was der Agent tatsächlich tun kann: API-Aufrufe, Datenbankschreibvorgänge, E-Mail-Versand, Websuchen, Dateioperationen, Kalendereinträge. Jede Aktion ist ein Werkzeug — eine Funktion, die das LLM aufrufen kann. Die Werkzeugmenge, die Sie dem Agenten geben, definiert seine Fähigkeiten und seine Risikooberfläche.

Reale Umsetzung: Ein 6-Monats-Agentic-AI-Projekt

So sieht ein realistischer Produktionszeitplan für einen mittelkomplexen zielorientierten Agenten aus:

Monat Phase Was gebaut wird
1 Architektur Agentendesign, Werkzeugauswahl, Datenpipeline-Aufbau
2 Kernagent Grundlegende Reasoning-Schleife + 1 Tool-Integration
3 Tool-Erweiterung 3–5 weitere Tools/Integrationen hinzufügen
4 Tests & Absicherungen Fehlermodi, menschliche Aufsichts-Hooks, Logging
5 Produktions-Deployment Live-Umgebung, Monitoring, Alerting
6 Messen & Iterieren ROI-Bewertung, Agentenverbesserung, Erweiterungsplanung

Kostenpunkte nach Komplexitätsstufe, basierend auf unserer Projekterfahrung:

Die Absicherungen, über die niemand spricht

Die meisten Agentenartikel konzentrieren sich auf Fähigkeiten. Wir konzentrieren uns auf Einschränkungen — denn dort leben oder sterben Produktionssysteme. Dies ist besonders kritisch für die Einhaltung des EU-KI-Gesetzes.

Unsere internen Daten aus Projekten von 2025: 70 % der Produktionsagenten-Ausfälle werden durch fehlende Absicherungen verursacht, nicht durch fehlerhafte Entscheidungslogik. Das Modell funktioniert einwandfrei. Die Infrastruktur darum herum nicht.

Unsere Modellempfehlungen für DACH-Unternehmen

Die Modellwahl hängt von Ihren Anforderungen an die Reasoning-Fähigkeit, Datensouveränität und bestehender Cloud-Infrastruktur ab. Hier ist unsere aktuelle Empfehlungsmatrix:

Modell Am besten für Kosten EU-Daten?
Claude 3.5 Sonnet Komplexes Denken, lange Dokumente Mittel Via AWS Bedrock
GPT-4o Allgemeinzweck, Vision-Aufgaben Mittel-Hoch Via Azure OpenAI
Llama 3.3 (selbst gehostet) Vollständige Datensouveränität Niedrig (Infrastrukturkosten) Ja
Gemini 1.5 Pro Google-Ökosystem-Integration Mittel Via GCP

Für die meisten DACH-Unternehmen ohne starke bestehende Cloud-Präferenz empfehlen wir den Start mit Claude 3.5 Sonnet via AWS Bedrock. Es bietet die beste Reasoning-Kapazität für dokumentenlastige Arbeitsabläufe, und die EU-Datenresidenz-Optionen von AWS Bedrock erfüllen die meisten Compliance-Anforderungen.

Wenn vollständige Datensouveränität nicht verhandelbar ist — häufig in Finanzdienstleistungen und dem Gesundheitswesen — ist selbst gehostetes Llama 3.3 auf EU-Infrastruktur die richtige Antwort. Der operative Aufwand ist höher, aber auch die Kontrolle.

Häufig gestellte Fragen

Brauche ich ein eigens trainiertes Modell für einen KI-Agenten?

Fast nie. Die meisten Produktionsagenten nutzen bestehende Frontier-Modelle (Claude, GPT-4) über eine API. Eigenes Training ist nur für hochspezialisierte Fachbereiche nötig — etwa medizinische Kodierung oder stark regulierte Finanzbegriffe. Für 95 % der geschäftlichen Anwendungsfälle liefern Prompt-Engineering und Retrieval-Augmented Generation (RAG) einen besseren ROI als Fine-Tuning.

Wie gehen KI-Agenten mit Fehlern um?

Gut konzipierte Agenten verfügen an jedem Schritt über Try/Catch-Logik, Fallback-Verhalten und Eskalations-Trigger. Wir bauen diese Absicherungen von Anfang an in jeden Agenten ein. Ein Produktionsagent sollte nie stillschweigend versagen — jeder Fehler wird protokolliert, kategorisiert und entweder automatisch behandelt oder mit vollem Kontext an einen Menschen eskaliert.

Was kostet der Betrieb eines KI-Agenten monatlich in der Produktion?

Für einen typischen Geschäftsprozessagenten, der 1.000 Aufgaben pro Tag verarbeitet: €300–800/Monat API-Kosten + €200–400/Monat Infrastruktur. Gesamt: €500–1.200/Monat. Dies skaliert näherungsweise linear mit dem Aufgabenvolumen. Agenten, die 10.000 Aufgaben/Tag verarbeiten, kosten typischerweise €3.000–8.000/Monat all-in.

Was ist der Unterschied zu Robotic Process Automation (RPA)?

RPA folgt festen Regeln. KI-Agenten denken über dynamische Situationen nach. RPA bricht ab, wenn sich eine Oberfläche ändert. KI-Agenten passen sich an. RPA erfordert exakte Schritt-für-Schritt-Skriptung. KI-Agenten können mit mehrdeutigen Eingaben und Randfällen umgehen. Das praktische Ergebnis: KI-Agenten erfordern mehr Anfangsinvestition, aber deutlich geringeren Wartungsaufwand über die Zeit.

Bereit, Ihren ersten KI-Agenten zu bauen?

Wir haben Produktionsagenten für Rechnungsverarbeitung, Kunden-Onboarding und Vertriebsautomatisierung gebaut. Lassen Sie uns Ihren planen.

Agentic AI erkunden