Wahl zwischen einem Agenten und einem Multi-Agenten-Schwarm für einen komplexen Workflow.
→Beginnen Sie mit einem einzelnen Agenten + Tools. Teilen Sie nur in mehrere Agenten auf, wenn Aufgabenabgrenzungen klar sind, Kontextfenster überlaufen oder unterschiedliche Modellebenen pro Unteraufgabe benötigt werden.
Warum: Multi-Agenten erhöhen Latenz, Fehleranfälligkeit und Orchestrierungskosten. Die meisten Produktions-Workloads sind mit einem gut ausgestatteten Agenten erfolgreich.
Der Agent muss Beobachtungen bewerten, bevor er erneut handelt.
→Implementieren Sie einen ReAct (Reason + Act)-Loop: Das Modell generiert einen Gedanken, wählt ein Tool aus, empfängt das Ergebnis und wiederholt dies, bis eine Stoppbedingung erfüllt ist.
Warum: ReAct macht die Zwischenbewertung sichtbar, verbessert die Debugging-Fähigkeit und ermöglicht es Ihnen, die Gedankenkette zu prüfen.
Der Agent muss mit externen Systemen (APIs, Datenbanken, Dateisystemen) interagieren.
→Definieren Sie Tools über die tool_use API. Das Modell gibt einen tool_use-Block aus; Ihr Code führt diesen aus und gibt ein tool_result zurück. Das Modell fährt dann fort.
Referenz↗
Der Orchestrator muss heterogene Unteraufgaben (Code-Review, Websuche, Datenanalyse) verteilen.
→Verwenden Sie einen Supervisor-Agenten, der das Ziel zerlegt, an spezialisierte Sub-Agenten delegiert und Ergebnisse aggregiert. Jeder Sub-Agent hat seinen eigenen System-Prompt und Toolsatz.
Mehrere Sub-Agenten müssen sich ohne direkte Peer-to-Peer-Kommunikation koordinieren.
→Leiten Sie alle Nachrichten zwischen Agenten über einen Supervisor. Der Supervisor entscheidet, welcher Sub-Agent als Nächstes läuft, übergibt den Kontext und erzwingt Reihenfolgebedingungen.
Warum: Direkte Peer-Nachrichten erzeugen Zyklen und erschweren die Nachverfolgung des Status. Ein zentraler Supervisor hält den Ausführungs-DAG explizit.
Der Agent muss den Kontext über eine Multi-Turn-Sitzung hinweg speichern.
→Übergeben Sie den vollständigen Konversationsverlauf (System + frühere Benutzer-/Assistenten-Turns) im Nachrichten-Array. Für lange Sitzungen fassen Sie ältere Turns zusammen, um im Kontextfenster zu bleiben.
Der Agent benötigt Persistenz über Sitzungen oder Benutzer hinweg.
→Speichern Sie Fakten in einer externen Speicherschicht (Vektordatenbank, Schlüssel-Wert-Speicher, Datei). Rufen Sie relevante Erinnerungen über RAG ab und injizieren Sie diese bei jedem Turn in den System-Prompt.
Das Team verwendet standardmäßig eine agentische Architektur für jede LLM-Funktion.
→Verwenden Sie keine Agenten, wenn ein einzelner Prompt + strukturierte Ausgabe ausreicht. Agenten erhöhen Latenz, Kosten und Fehlermöglichkeiten. Reservieren Sie agentische Loops für Aufgaben, die Iteration oder Tool-Nutzung erfordern.
Eine komplexe Denkaufgabe erfordert mehr interne Überlegung vor der Antwort.
→Ermöglichen Sie erweitertes Denken mit einem budget_tokens-Parameter. Das Modell verwendet einen Denkblock, bevor es antwortet, was die Genauigkeit bei mehrstufigen Problemen verbessert.
Warum: Erweitertes Denken tauscht Latenz gegen Qualität. Setzen Sie budget_tokens proportional zur Aufgabenkomplexität; begrenzen Sie es, um die Kosten zu kontrollieren.
Referenz↗
Tool-Aufruf gibt einen Fehler zurück; Agent muss sich elegant erholen.
→Geben Sie den Fehler als tool_result mit is_error: true zurück. Das Modell erkennt den Fehler und kann es mit korrigierten Parametern erneut versuchen, ein alternatives Tool ausprobieren oder den Fehler dem Benutzer erklären.
Referenz↗
Temporäre API-Fehler (429, 529) während eines agentischen Loops.
→Implementieren Sie exponentielles Backoff mit Jitter. Bei 429 (Rate Limit) beachten Sie den retry-after Header. Bei 529 (überlastet) länger zurücktreten. Versuchen Sie niemals 400er-Fehler blind erneut.
Messen, ob sich ein agentisches System im Laufe der Zeit tatsächlich verbessert.
→Erstellen Sie eine Evaluierungssuite: Definieren Sie Input-Output-Paare, führen Sie den Agenten aus, bewerten Sie Ausgaben (exakte Übereinstimmung, LLM als Richter, menschliche Überprüfung). Verfolgen Sie die Erfolgsquote pro Release.
Warum: Ohne Evaluierungen sind Prompt-Anpassungen Ratespiele. Regressionserkennung erfordert eine automatisierte, wiederholbare Bewertung.
Der Agent erzeugt beim ersten Durchlauf eine minderwertige Ausgabe.
→Fügen Sie einen Reflexionsschritt hinzu: Nach dem Generieren einer Antwort fordern Sie das Modell auf, seine eigene Ausgabe zu kritisieren und zu überarbeiten. Verwenden Sie einen separaten Nachrichten-Turn oder erweitertes Denken.
Agentischer Workflow führt irreversible Aktionen aus (Ressourcen löschen, E-Mails senden).
→Fügen Sie einen Prüfpunkt vor destruktiven Operationen ein. Präsentieren Sie dem Benutzer die geplante Aktion, warten Sie auf Genehmigung und führen Sie sie dann aus. Protokollieren Sie die Entscheidung zur Überprüfung.