agent को बाहरी API, डेटाबेस या फ़ाइलों के साथ इंटरैक्ट करना चाहिए।
→क्षमताओं को टाइप किए गए फ़ंक्शन/टूल परिभाषाओं के रूप में उजागर करें; मॉडल एक टूल कॉल उत्सर्जित करता है, आपका कोड उसे निष्पादित करता है और परिणाम लौटाता है, फिर लूप जारी रहता है।
क्यों: संरचित टूल कॉलिंग फ्री-टेक्स्ट निर्देशों को पार्स करने की तुलना में अधिक विश्वसनीय और ऑडिट करने योग्य है।
agent को फिर से कार्य करने से पहले टिप्पणियों के बारे में सोचना चाहिए।
→एक ReAct लूप लागू करें: मॉडल एक विचार उत्पन्न करता है, एक टूल का चयन करता है, अवलोकन प्राप्त करता है, और एक स्टॉप शर्त पूरी होने तक दोहराता है।
क्यों: तर्क और कार्रवाई को इंटरलीव करने से डिबगिंग के लिए श्रृंखला उजागर होती है और मल्टी-स्टेप सटीकता में सुधार होता है।
मॉडल टूल आर्गुमेंट का दुरुपयोग करता है या hallucinate करता है।
→सटीक टूल विवरण लिखें, आर्गुमेंट प्रकारों और enums को सीमित करें, और प्रति टूल एक या दो उपयोग उदाहरण प्रदान करें।
क्यों: अधिकांश टूल-कॉल त्रुटियाँ अस्पष्ट schemas से उत्पन्न होती हैं; विवरण टूल के लिए प्रॉम्प्ट है।
डाउनस्ट्रीम कोड को agent से विश्वसनीय JSON की आवश्यकता है।
→जेनरेशन को JSON schema (संरचित आउटपुट) तक सीमित करें, न कि फ्री टेक्स्ट को पार्स करने तक, और उपयोग से पहले validate करें।
क्यों: Schema-constrained डिकोडिंग नाजुक regex पार्सिंग और साइलेंट फ़ॉर्मेट ड्रिफ्ट को समाप्त करता है।
NVIDIA स्टैक पर एक प्रोडक्शन agent बनाना।
→एजेंटों, टूल और वर्कफ़्लो को संयोजित करने के लिए NeMo Agent Toolkit का उपयोग करें, NIM-served बैकएंड को मॉडल कॉल को वायर करें।
क्यों: टूलकिट agent प्लंबिंग को मानकीकृत करता है और NVIDIA सर्विंग के साथ मूल रूप से एकीकृत होता है।
संदर्भ↗
एक टूल एक त्रुटि लौटाता है या टाइम आउट हो जाता है।
→त्रुटि को टूल परिणाम के रूप में मॉडल पर वापस लौटाएं ताकि वह पुनः प्रयास कर सके, आर्गुमेंट को समायोजित कर सके, या एक वैकल्पिक पथ चुन सके।
क्यों: एजेंट को विफलताओं को सामने लाने से रिकवरी सक्षम होती है; उन्हें निगलने से agent अंधा हो जाता है।
एक चरण में कई स्वतंत्र टूल कॉल की आवश्यकता होती है।
→जब मॉडल इसका समर्थन करता है और कॉल में कोई ऑर्डरिंग निर्भरता नहीं होती है, तो समानांतर में टूल कॉल जारी करें, फिर परिणामों को मर्ज करें।
क्यों: समानांतर निष्पादन मल्टी-सोर्स लुकअप जैसे फैन-आउट काम के लिए वॉल-क्लॉक विलंबता को कम करता है।
एक विशेषज्ञ क्षमता वर्कफ़्लो में पुनः प्रयोज्य होनी चाहिए।
→एक सब-agent को एक सिंगल टूल इंटरफ़ेस के पीछे लपेटें ताकि पैरेंट इसे किसी अन्य टूल की तरह इनवोक कर सके।
क्यों: सब-एजेंटों को टूल के रूप में मानना कंपोजीशन को एक समान रखता है और आंतरिक जटिलता को छुपाता है।
agent कार्य से भटक जाता है या बाधाओं को अनदेखा करता है।
→एक संक्षिप्त सिस्टम प्रॉम्प्ट में भूमिका, अनुमत टूल, आउटपुट प्रारूप और कठोर बाधाओं को पिन करें; अंत के पास महत्वपूर्ण नियमों को दोहराएं।
क्यों: एक टाइट सिस्टम प्रॉम्प्ट agent व्यवहार पर सबसे सस्ता, सबसे अधिक प्रभावकारी नियंत्रण है।