Выбор между одним агентом и роем из нескольких агентов для сложного рабочего процесса.
→Начните с одного агента + инструментов. Разделяйте на несколько агентов только тогда, когда границы задач ясны, контекстные окна переполняются или для подзадач требуются разные уровни моделей.
Почему: Многоагентная система добавляет задержки, увеличивает поверхность ошибок и стоимость оркестрации. Большинство рабочих нагрузок в продакшене успешно выполняются одним хорошо оснащенным агентом.
Агент должен обдумывать наблюдения, прежде чем снова действовать.
→Реализуйте цикл ReAct (Рассуждай + Действуй): модель генерирует мысль, выбирает инструмент, получает результат и повторяет до тех пор, пока не будет выполнено условие остановки.
Почему: ReAct делает промежуточные рассуждения видимыми, улучшая отладку и позволяя проверять цепочку мыслей.
Агенту необходимо взаимодействовать с внешними системами (API, базы данных, файловые системы).
→Определите инструменты через API tool_use. Модель выдает блок tool_use; ваш код выполняет его и возвращает tool_result. Затем модель продолжает работу.
Источник↗
Оркестратор должен распределять разнородные подзадачи (проверка кода, веб-поиск, анализ данных).
→Используйте агент-супервизор, который декомпозирует цель, делегирует задачи специализированным подагентам и агрегирует результаты. Каждый подагент имеет свой собственный системный промпт и набор инструментов.
Несколько подагентов должны координироваться без прямого взаимодействия друг с другом.
→Направляйте все меж-агентные сообщения через супервизора. Супервизор решает, какой подагент запускается следующим, передает контекст и обеспечивает соблюдение ограничений порядка.
Почему: Прямой обмен сообщениями между узлами создает циклы и затрудняет отслеживание состояния. Центральный супервизор явно поддерживает DAG выполнения.
Агент должен запоминать контекст на протяжении многораундовой сессии.
→Передавайте полную историю разговора (системные + предыдущие реплики пользователя/ассистента) в массиве messages. Для длительных сессий суммируйте старые реплики, чтобы оставаться в пределах контекстного окна.
Агенту требуется сохранение состояния между сессиями или между пользователями.
→Храните факты во внешнем слое памяти (векторная БД, хранилище ключ-значение, файл). Извлекайте соответствующие воспоминания через RAG и вставляйте их в системный промпт на каждом шаге.
Команда по умолчанию использует агентную архитектуру для каждой функции LLM.
→Не используйте агентов, если достаточно одного промпта + структурированного вывода. Агенты добавляют задержки, стоимость и режимы отказа. Резервируйте агентные циклы для задач, требующих итерации или использования инструментов.
Сложная задача рассуждения требует большей внутренней проработки перед ответом.
→Включите расширенное мышление с параметром budget_tokens. Модель использует блок мышления перед ответом, улучшая точность при решении многошаговых задач.
Почему: Расширенное мышление обменивает задержку на качество. Установите budget_tokens пропорционально сложности задачи; ограничьте его для контроля стоимости.
Источник↗
Вызов инструмента возвращает ошибку; агент должен корректно восстановиться.
→Верните ошибку как tool_result с is_error: true. Модель увидит сбой и сможет повторить попытку с исправленными параметрами, попробовать альтернативный инструмент или объяснить сбой пользователю.
Источник↗
Временные сбои API (429, 529) во время агентного цикла.
→Реализуйте экспоненциальную задержку с дрожанием (jitter). При 429 (ограничение скорости) соблюдайте заголовок retry-after. При 529 (перегрузка) отступайте дольше. Никогда не повторяйте ошибки класса 400 вслепую.
Измерение того, улучшается ли агентная система со временем.
→Создайте набор для оценки: определите пары вход-выход, запустите агента, оцените выводы (точное совпадение, LLM-в-качестве-судьи, человеческий обзор). Отслеживайте процент прохождения на каждый релиз.
Почему: Без оценок настройка промптов — это догадки. Обнаружение регрессий требует автоматизированной, повторяемой оценки.
Агент производит низкокачественный вывод с первой попытки.
→Добавьте шаг рефлексии: после генерации ответа предложите модели критически оценить свой собственный вывод и пересмотреть его. Используйте отдельный ход сообщения или расширенное мышление.
Агентный рабочий процесс выполняет необратимые действия (удаление ресурсов, отправка электронных писем).
→Вставьте контрольную точку перед деструктивными операциями. Представьте планируемое действие пользователю, дождитесь одобрения, затем выполните. Запишите решение для аудита.