ה-agent חייב לקיים אינטראקציה עם APIs חיצוניים, מסדי נתונים או קבצים.
→חשוף יכולות כהגדרות פונקציות/כלים מוגדרות; המודל פולט קריאת כלי, הקוד שלך מבצע אותה ומחזיר את התוצאה, ואז הלולאה ממשיכה.
למה: קריאת כלי מובנית אמינה יותר וניתנת לביקורת מאשר ניתוח הוראות בטקסט חופשי.
ה-agent חייב להסיק מסקנות לגבי תצפיות לפני שהוא פועל שוב.
→יישם לולאת ReAct: המודל מייצר מחשבה, בוחר כלי, מקבל את התצפית, וחוזר על הפעולה עד לעמידה בתנאי עצירה.
למה: שילוב חשיבה ופעולה חושף את השרשרת לניפוי באגים ומשפר את הדיוק בריבוי שלבים.
המודל משתמש לרעה או מדמיין (hallucinates) ארגומנטים של כלים.
→כתוב תיאורים מדויקים של כלים, הגבל סוגי ארגומנטים ו-enums, וספק דוגמה אחת או שתיים לשימוש לכל כלי.
למה: רוב שגיאות קריאת הכלים נובעות מסכימות מעורפלות; התיאור הוא ה-prompt עבור הכלי.
קוד במורד הזרם (downstream) זקוק ל-JSON אמין מה-agent.
→הגבל את היצירה לסכימת JSON (פלט מובנה) במקום לנתח טקסט חופשי, ובדוק תקינות לפני השימוש.
למה: פענוח מוגבל על ידי סכימה מבטל ניתוח regex שביר וסטייה שקטה בפורמט.
בניית agent בסביבת ייצור על גבי ערימת NVIDIA.
→השתמש ב-NeMo Agent Toolkit כדי להרכיב agents, tools, ותהליכי עבודה, ולחבר קריאות מודלים לקצה האחורי (backends) המוגש על ידי NIM.
למה: ה-toolkit מתקנן את הצינורות (plumbing) של ה-agent ומשתלב באופן טבעי עם שירותי NVIDIA.
מקור↗
כלי מחזיר שגיאה או פג זמן.
→החזר את השגיאה בחזרה למודל כתוצאה של הכלי כדי שיוכל לנסות שוב, להתאים ארגומנטים או לבחור נתיב חלופי.
למה: חשיפת כשלים ל-agent מאפשרת התאוששות; בליעתם משאירה את ה-agent עיוור.
נדרשות מספר קריאות כליות עצמאיות בשלב אחד.
→בצע קריאות כליות במקביל כאשר המודל תומך בכך ואין תלות בסדר הקריאות, ולאחר מכן מיזג את התוצאות.
למה: ביצוע מקבילי מקצר את זמן ההשהיה הכולל (wall-clock latency) לעבודת fan-out כמו בדיקות מרובות מקורות.
יכולת מומחה צריכה להיות ניתנת לשימוש חוזר בתהליכי עבודה שונים.
→עטוף סוכן משנה מאחורי ממשק כלי יחיד כך שההורה יפעיל אותו כמו כל כלי אחר.
למה: התייחסות לסוכני משנה ככלים שומרת על אחידות ההרכבה ומסתירה מורכבות פנימית.
ה-agent סוטה מהמשימה או מתעלם ממגבלות.
→קבע את התפקיד, הכלים המותרים, פורמט הפלט והמגבלות הקשות ב-system prompt תמציתי; חזור על כללים קריטיים לקראת הסוף.
למה: system prompt הדוק הוא הבקרה הזולה ביותר והיעילה ביותר על התנהגות ה-agent.