Agentische Workflows

From Systems analysis wiki
Jump to navigation Jump to search

Agentische Workflows (Agentic Workflows) sind dynamische, mehrstufige Prozesse, in denen autonome KI-Agenten, die auf großen Sprachmodellen (LLM) basieren, selbstständig Entscheidungen treffen, Aktionen ausführen und Aufgaben mit minimaler menschlicher Beteiligung koordinieren[1]. In solchen Systemen wird ein LLM nicht nur zur Generierung einer Antwort auf eine einzelne Anfrage verwendet, sondern auch zur Planung von Handlungssequenzen, zur Interaktion mit externen Werkzeugen und zur iterativen Verbesserung des Ergebnisses.

Im Gegensatz zur traditionellen Automatisierung, die auf fest programmierten Regeln basiert, sind agentische Ansätze flexibel – sie können sich an neue Daten und unvorhergesehene Bedingungen anpassen. Ein agentischer Workflow unterscheidet sich von einem einfachen LLM-Aufruf (z. B. zur Zusammenfassung eines Textes) dadurch, dass der Agent mit Autonomie bei der Wahl seiner Handlungen ausgestattet ist, was Planung, den Einsatz von Werkzeugen und Selbstkorrektur umfasst[2].

Komponenten und Architektur eines agentischen Workflows

Ein agentischer Workflow vereint mehrere Schlüsselkomponenten, um ein Ziel zu erreichen.

KI-Agent und LLM

Im Zentrum des Prozesses steht der KI-Agent – ein autonomes Programm, das im Namen eines Benutzers oder Systems handelt. Die Schlüsselkomponente des Agenten ist ein großes Sprachmodell, das das Verständnis von Anweisungen in natürlicher Sprache und die Generierung der erforderlichen logischen Schlussfolgerungen ermöglicht. Die Qualität der Arbeit des Agenten hängt maßgeblich vom Prompt-Engineering ab – verschiedene Prompt-Schemata (z. B. Chain-of-Thought) helfen dabei, das LLM auf den gewünschten Arbeitsstil einzustellen[1].

Werkzeuge (Zugriff auf externe Aktionen)

Da das Wissen eines LLM auf seine Trainingsdaten beschränkt ist, werden dem Agenten externe Werkzeuge zur Verfügung gestellt, die seine Fähigkeiten erweitern. Diese Werkzeuge können den Zugriff auf Wissensdatenbanken, Suchmaschinen, APIs, Code-Interpreter und andere Anwendungen umfassen. Mit ihrer Hilfe kann der Agent aktuelle Informationen abrufen oder reale Aktionen außerhalb des Modells selbst ausführen[2].

Gedächtnis und Kontext

Ein charakteristisches Merkmal von agentischen Workflows ist das Vorhandensein eines Gedächtnismechanismus, der es dem Agenten ermöglicht, frühere Erfahrungen und den Kontext zu berücksichtigen.

  • Das Kurzzeitgedächtnis speichert aktuelle Informationen (z. B. den Dialogverlauf) innerhalb der aktuellen Sitzung.
  • Das Langzeitgedächtnis bewahrt Wissen und Ergebnisse, die über viele Durchläufe gesammelt wurden, oft unter Verwendung externer Speicher (z. B. Vektordatenbanken)[3].

Feedback und Korrektur

Feedback-Mechanismen spielen eine wichtige Rolle bei der Erhöhung der Zuverlässigkeit. Ein Agent kann Feedback von der Ausführungsumgebung der Aufgabe, von einem unterstützenden „Kritiker“-Modell oder von einem Menschen (im Human-in-the-Loop-Modus) erhalten. Beispielsweise implementiert das System Reflexion eine interne Selbstreflexion: Der Agent analysiert seine eigenen Fehler und speichert „Überlegungen“ im Gedächtnis, um nachfolgende Versuche zu verbessern[4].

Multi-Agenten-Konfigurationen

In komplexen Szenarien wird eine Multi-Agenten-Architektur verwendet, in der mehrere spezialisierte Agenten miteinander interagieren. Beispielsweise legt ein „Planer“-Agent Teilaufgaben fest, während mehrere „Ausführer“-Agenten ihre spezifischen Aufgaben lösen (Datensuche, Berechnungen usw.)[1].

Typische Muster und Algorithmen für Agenten

Obwohl es noch keine universelle standardisierte Architektur für agentische LLM-Systeme gibt, haben sich in den Jahren 2023–2024 wiederkehrende Muster herausgebildet[5].

  • Schrittweise Planung (Prompt Chaining). Die Aufgabe wird mithilfe einer Kette von LLM-Aufrufen in eine Sequenz von Schritten zerlegt. Jeder Schritt erhält das Ergebnis des vorherigen als Eingabe und führt einen Teil der Gesamtaufgabe aus. Dieser Ansatz verbessert die Interpretierbarkeit, ist jedoch weniger flexibel.
  • Routing und Werkzeugauswahl (Router Pattern). Der Agent klassifiziert zunächst den Typ der eingehenden Aufgabe und wählt dann einen speziellen Prozess oder ein Werkzeug zur Lösung aus, wobei er als eine Art Dispatcher fungiert.
  • Parallele Lösungssuche. Anstelle eines einzigen linearen Gedankengangs werden mehrere Lösungsoptionen gleichzeitig untersucht. Ein Beispiel hierfür ist der Tree-of-Thoughts-Ansatz, bei dem der Agent die Argumentationskette wie einen Baum verzweigt, in jedem Schritt mehrere „Gedanken“-Kandidaten generiert und die vielversprechendsten auswählt[6].
  • Reflexion und Selbstkorrektur. Der Agent bewertet seine eigenen Entscheidungen kritisch und lernt aus Fehlern. Bei der Reflexion-Methode analysiert der Agent nach jedem Versuch das Ergebnis und speichert Schlussfolgerungen, die er in nachfolgenden Zyklen verwendet[4].

Beispiele für bekannte Ansätze

  • ReAct (Reasoning and Acting) – eine grundlegende Methode (2022), die logisches Schließen (Reasoning) und Handeln (Acting) kombiniert. Das LLM generiert abwechselnd logische Schlussfolgerungen (thoughts) und konkrete Handlungsschritte (actions), die mithilfe von Werkzeugen ausgeführt werden[7].
  • Reflexion (2023) – ein Framework zur Selbstreflexion, das es Agenten ermöglicht, durch textbasiertes Feedback aus eigenen Fehlern zu lernen, ohne die Modellgewichte zu aktualisieren[4].
  • Tree-of-Thoughts (ToT) (2023) – ein Framework, das die Idee von Chain-of-Thought erweitert, indem es die Lösungssuche als Baum organisiert, was dem Modell ermöglicht, mehrere mögliche Entwicklungen zu durchdenken[6].
  • Auto-GPT (2023) – eines der ersten weithin bekannten Open-Source-Projekte, das einen vollständig autonomen agentischen Workflow demonstriert. Das System generiert eine Gruppe spezialisierter GPT-4-Agenten, die gemeinsam Schritte planen und ausführen, um ein vom Benutzer vorgegebenes übergeordnetes Ziel zu erreichen[3].

Anwendung und Auswirkungen

Agentische Ansätze finden in zahlreichen Bereichen Anwendung, in denen intelligente Automatisierung und Flexibilität erforderlich sind.

  • Geschäftsprozesse: Agentische Systeme erweitern die Fähigkeiten von Support-Chatbots, die selbstständig Probleme diagnostizieren und Lösungen finden können. Sie werden auch im Finanzwesen, im Personalmanagement und im Marketing eingesetzt[1].
  • Generative Simulationen: Autonome LLM-Agenten können komplexes Verhalten von Gemeinschaften oder Charakteren modellieren. In der Arbeit „Generative Agents“ (Park et al., 2023) imitierten Dutzende von GPT-Agenten mit unterschiedlichen Persönlichkeiten glaubhaft das soziale Leben in einer simulierten Kleinstadt.

Nach Einschätzung der Analysten von Gartner gehört die agentische KI (Agentic AI) zu den strategischen Technologietrends für das Jahr 2025[1].

Herausforderungen und Zukunftsperspektiven

Trotz der Erfolge bleiben agentische LLM-Systeme eine neue und komplexe Technologie.

  • Ressourcenaufwand: Jeder zusätzliche Schritt der Planung, Suche oder Selbstreflexion ist ein separater LLM-Aufruf, was die Ausführungszeit und die Kosten erhöht.
  • Unvorhersehbarkeit des Verhaltens: Je mehr Freiheit ein Agent hat, desto schwieriger ist es zu garantieren, welchen Weg er einschlagen wird. Dies erfordert die Implementierung von Beschränkungen und Schutzmechanismen (Guardrails).
  • Qualitätsbewertung und Debugging: Die Analyse umfangreicher Protokolle von mehrstufigen Systemen zur Fehlersuche ist eine nicht triviale Aufgabe.
  • Sicherheit und Ethik: Mit zunehmender Autonomie der KI entsteht die Notwendigkeit sicherzustellen, dass die Agenten im Interesse des Benutzers und der Gesellschaft handeln.

Zukünftige Forschungen zielen darauf ab, universelle Werkzeuge für den Tool-Einsatz zu schaffen, einheitliche End-to-End-Workflows zu entwickeln und die Effizienz agentischer Systeme zu optimieren[8].

Literatur

  • Yao, S. et al. (2022). ReAct: Synergizing Reasoning and Acting in Language Models. arXiv:2210.03629.
  • Schick, T. et al. (2023). Toolformer: Language Models Can Teach Themselves to Use Tools. arXiv:2302.04761.
  • Liu, X. et al. (2023). AgentBench: Evaluating LLMs as Agents. arXiv:2308.03688.
  • Yao, S. et al. (2023). Tree of Thoughts: Deliberate Problem Solving with Large Language Models. arXiv:2305.10601.
  • Shinn, N. et al. (2023). Reflexion: Language Agents with Verbal Reinforcement Learning. arXiv:2303.11366.
  • Park, J. S. et al. (2023). Generative Agents: Interactive Simulacra of Human Behavior. arXiv:2304.03442.
  • Wang, G. et al. (2023). Voyager: An Open-Ended Embodied Agent with Large Language Models. arXiv:2305.16291.
  • Bakhtin, A. et al. (2022). Human-Level Play in the Game of Diplomacy by Combining Language Models with Strategic Reasoning. Science. DOI:10.1126/science.ade9097.
  • Wang, L. et al. (2025). A Survey on Large Language Model based Autonomous Agents. arXiv:2308.11432.
  • Li, X. (2024). A Survey on LLM-Based Agentic Workflows and LLM-Profiled Components. arXiv:2406.05804.
  • Jung, J. et al. (2024). Trust or Escalate: LLM Judges with Provable Guarantees for Human Agreement. arXiv:2407.18370.
  • Xu, W. et al. (2025). A-MEM: Agentic Memory for LLM Agents. arXiv:2502.12110.
  • He, G. et al. (2025). Plan-Then-Execute: An Empirical Study of User Trust and Team Performance When Using LLM Agents as a Daily Assistant. arXiv:2502.01390.
  • Huang, X. et al. (2024). Understanding the Planning of LLM Agents: A Survey. arXiv:2402.02716.
  • Kuang, Z. et al. (2023). PEARL: Prompting Large Language Models to Plan and Execute Reasoning over Long Documents. arXiv:2305.14564.

Anmerkungen

  1. 1.0 1.1 1.2 1.3 1.4 „What are Agentic Workflows?“. IBM. [1]
  2. 2.0 2.1 „What Are Agentic Workflows? Patterns, Use Cases, Examples, and More“. Weaviate. [2]
  3. 3.0 3.1 „What is AutoGPT?“. IBM. [3]
  4. 4.0 4.1 4.2 Shinn, N. et al. „Reflexion: Language Agents with Verbal Reinforcement Learning“. arXiv:2303.11366, 2023. [4]
  5. „Agentic Workflows in 2025: The ultimate guide“. Vellum.ai. [5]
  6. 6.0 6.1 Yao, S. et al. „Tree of Thoughts: Deliberate Problem Solving with Large Language Models“. arXiv:2305.10601, 2023. [6]
  7. Yao, S. et al. „ReAct: Synergizing Reasoning and Acting in Language Models“. arXiv:2210.03629, 2022. [7]
  8. Li, X. „A Survey on LLM-Based Agentic Workflows and LLM-Profiled Components“. arXiv:2406.05804, 2024. [8]