Die Wahl zwischen einem einzelnen Agenten und einem Multi-Agenten-System für einen komplexen Workflow.
→Standardmäßig einen einzelnen Agenten mit Tools verwenden. Nur dann in mehrere Agenten aufteilen, wenn Aufgaben klar voneinander abgegrenzt sind, der Kontext überläuft oder unterschiedliche Modellebenen für verschiedene Unteraufgaben geeignet sind.
Warum: Jeder hinzugefügte Agent vervielfacht Latenz, Fehleranfälligkeit und Orchestrierungskosten; die meisten Workloads sind mit einem gut ausgestatteten Agenten erfolgreich.
Der Orchestrator muss heterogene Unteraufgaben an Spezialisten verteilen.
→Einen Supervisor-Agenten verwenden, der das Ziel zerlegt, an Worker-Agenten mit eigenen Prompts und Tools weiterleitet und die Ergebnisse aggregiert.
Warum: Zentrale Kontrolle hält den Zustand kohärent und macht die Entscheidungsgrenze prüfbar, im Gegensatz zu einem unkontrollierten Schwarm.
Der Agenten-Flow hat bedingte Verzweigungen, Schleifen und parallele Fan-Outs.
→Den Workflow als expliziten Graphen von Knoten und Kanten modellieren, anstatt als freie Schleife, damit der Kontrollfluss deterministisch und fortsetzbar ist.
Warum: Ein Graph macht Verzweigungen testbar und ermöglicht es, nach einem Fehler einen Checkpoint zu setzen und von jedem Knotenpunkt aus neu zu starten.
Eingehende Anfragen variieren stark in Typ und Kosten.
→Das System mit einem leichtgewichtigen Router-Agenten vorschalten, der die Absicht klassifiziert und an den günstigsten, fähigen nachgeschalteten Agenten oder Tool weiterleitet.
Warum: Routing vermeidet die Kosten eines frontier-model für triviale Anfragen und isoliert Verantwortlichkeiten pro Pfad.
Mehrere Agenten müssen einen gemeinsamen Workflow-Zustand lesen und schreiben.
→Den Zustand in einen gemeinsamen Speicher (Key-Value oder Dokument) auslagern, der nach Session-ID organisiert ist, anstatt das vollständige Transkript zwischen Agenten zu übergeben.
Warum: Ein gemeinsamer Speicher begrenzt das Kontextwachstum und verhindert divergierende Zustands-Kopien über Agenten hinweg.
Agenten für horizontale Skalierung entwerfen.
→Die Agentenberechnung zustandslos halten; Konversation und Gedächtnis extern persistieren, damit jede Replika jede Anfrage aufnehmen kann.
Warum: Zustandslose Knoten skalieren sauber und überleben Pod-Neustarts, ohne laufende Arbeiten zu verlieren.
Ein Sub-Agent oder Tool fällt mitten im Workflow aus.
→Idempotente Schritte mit Wiederholung/Backoff, kompensierenden Aktionen für Nebeneffekte und einem Fallback-Pfad oder einer menschlichen Eskalation entwerfen, wenn Wiederholungsversuche erschöpft sind.
Warum: Agentensysteme versagen teilweise; die Wiederherstellung muss ein primäres Designanliegen sein, keine nachträgliche Überlegung.
Sub-Agenten werden von separaten Teams entwickelt.
→Den Eingabe-/Ausgabekontrakt jedes Agenten als typisiertes Schema definieren und Agenten als Dienste hinter stabilen Schnittstellen behandeln.
Warum: Explizite Kontrakte ermöglichen es Agenten, sich unabhängig zu entwickeln und isoliert getestet zu werden.
Die Ausgabequalität des Agenten ist bei schwierigen Aufgaben inkonsistent.
→Einen Kritiker-/Reflexionsschritt hinzufügen, der den Entwurf anhand von Kriterien überprüft und einen begrenzten Wiederholungsversuch auslöst, bevor er zurückgegeben wird.
Warum: Selbstkritik fängt Fehler kostengünstig ab, aber die Iterationen begrenzen, um unkontrollierte Schleifen und Kosten zu vermeiden.