C1000-185मार्गदर्शिका

मार्गदर्शिका — C1000-185 IBM Certified watsonx Generative AI Engineer - Associate

अंतिम समीक्षा: जून 2026

C1000-185 परीक्षा द्वारा परखे जाने वाले architectural patterns का स्कैन-योग्य संदर्भ। ऊपर से नीचे पढ़ें या किसी section पर जाएं।

फ़ाउंडेशन मॉडल और प्रॉम्प्ट इंजीनियरिंग

एंटरप्राइज़ को अनुमेय लाइसेंसिंग और क्षतिपूर्ति के साथ एक निर्देश-अनुपालक मॉडल की आवश्यकता है।

किसी थर्ड-पार्टी होस्टेड मॉडल के बजाय watsonx.ai कैटलॉग से एक IBM Granite instruct मॉडल चुनें।

क्यों: Granite मॉडल IBM-निर्मित, शासित हैं और IBM की IP क्षतिपूर्ति का वहन करते हैं — विनियमित वर्कलोड के लिए डिफ़ॉल्ट सुरक्षित विकल्प।

संदर्भ

एकल-बारी निष्कर्षण कार्य के लिए चैट-ट्यून किए गए और निर्देश-ट्यून किए गए वेरिएंट के बीच चयन करना।

स्पष्ट निर्देश प्रॉम्प्ट के साथ instruct वेरिएंट का उपयोग करें; चैट मॉडल को बहु-बारी संवाद के लिए आरक्षित करें।

क्यों: चैट मॉडल भूमिका-संरचित बारी की अपेक्षा करते हैं; वन-शॉट कार्यों के लिए instruct मॉडल सरल और सस्ता है।

अनुपालन रिपोर्ट के लिए आउटपुट नियतात्मक और प्रतिलिपि प्रस्तुत करने योग्य होना चाहिए।

डीकोडिंग को ग्रीडी (कोई सैंपलिंग नहीं) पर सेट करें ताकि उच्चतम-संभावना वाला टोकन हमेशा चुना जाए।

क्यों: ग्रीडी डीकोडिंग यादृच्छिकता को हटाता है; तापमान के साथ सैंपलिंग भिन्नता प्रस्तुत करती है जिसे आप ऑडिट किए गए आउटपुट में नहीं चाहते हैं।

संदर्भ

रचनात्मक कॉपी जनरेशन दोहराव वाला और नीरस लगता है।

टोकन वितरण को व्यापक बनाने के लिए सैंपलिंग डीकोडिंग पर स्विच करें और तापमान बढ़ाएँ (जैसे 0.7-1.0)।

क्यों: उच्च तापमान संभावनाओं को समतल करता है ताकि निचले-रैंक वाले टोकन चुने जा सकें, जिससे विविधता बढ़ती है।

सैंपलिंग आउटपुट कभी-कभी दुर्लभ टोकन के साथ विषय से भटक जाता है।

उम्मीदवारों को सबसे संभावित टोकन तक सीमित करने के लिए top-k या top-p (न्यूक्लियस) के साथ सैंपलिंग को सीमित करें।

क्यों: top-k उम्मीदवार संख्या को सीमित करता है; top-p संचयी संभावना द्रव्यमान को सीमित करता है — दोनों लंबी पूंछ को काटते हैं जो बहाव का कारण बनती है।

मॉडल लूप करता है, उसी वाक्यांश या वाक्य को दोहराता है।

हाल के टोकन को फिर से उत्सर्जित करने से रोकने के लिए पुनरावृत्ति दंड पैरामीटर बढ़ाएँ।

क्यों: यह दंड पहले से देखे गए टोकन की संभावना को कम करता है; केवल स्टॉप सीक्वेंस ही मध्य-उत्पादन लूप को ठीक नहीं करते हैं।

उत्पादन उत्तर से आगे बढ़कर काल्पनिक अनुवर्ती पाठ में चला जाता है।

एक या अधिक स्टॉप सीक्वेंस (जैसे "\n\n", "###") परिभाषित करें ताकि उत्पादन एक ज्ञात सीमा पर रुक जाए।

क्यों: स्टॉप सीक्वेंस आउटपुट को नियतात्मक रूप से समाप्त करते हैं; केवल अधिकतम टोकन पर भरोसा करने से वाक्य के बीच में ही कट जाता है।

अनुरोधित JSON को पूरा करने से पहले प्रतिक्रियाएँ कट रही हैं।

अधिकतम नए टोकन बढ़ाएँ; आवश्यकता पड़ने पर न्यूनतम-लंबाई के उत्तर को लागू करने के लिए न्यूनतम नए टोकन सेट करें।

क्यों: max new tokens आउटपुट लंबाई को बांधता है; यदि बहुत कम हो तो यह क्लोजिंग ब्रेस से पहले संरचित आउटपुट को छोटा कर देता है।

ज़ीरो-शॉट वर्गीकरण किनारे के मामलों को गलत लेबल करता है।

सीधे प्रॉम्प्ट में कुछ लेबल किए गए इनपुट/आउटपुट उदाहरण (फ़्यू-शॉट) जोड़ें।

क्यों: फ़्यू-शॉट उदाहरण बिना किसी ट्यूनिंग के संदर्भ में आउटपुट प्रारूप और निर्णय सीमा निर्धारित करते हैं।

टीम कोई कोड लिखने से पहले प्रॉम्प्ट पर पुनरावृति करना चाहती है।

Prompt Lab का उपयोग करें — फ्रीफ़ॉर्म, संरचित और चैट मोड के बीच स्विच करें, मापदंडों को ट्यून करें, फिर प्रॉम्प्ट टेम्पलेट के रूप में सहेजें।

क्यों: Prompt Lab नो-कोड पुनरावृति सतह है; संरचित मोड निर्देश, उदाहरण और इनपुट को स्पष्ट रूप से अलग करता है।

संदर्भ

लंबे दस्तावेज़ चयनित मॉडल की संदर्भ विंडो से अधिक हैं।

दस्तावेज़ों को खंडित करें और केवल प्रासंगिक मार्ग (RAG) पुनर्प्राप्त करें या कैटलॉग से एक लंबा-संदर्भ मॉडल चुनें।

क्यों: आप मॉडल की टोकन सीमा से अधिक नहीं हो सकते; अधिक पाठ डालने से चुपचाप ड्रॉप या त्रुटियाँ होती हैं — पुनर्प्राप्ति स्केलेबल समाधान है।

मॉडल प्रशिक्षण, ट्यूनिंग और मूल्यांकन

Prompt engineering एक संकीर्ण डोमेन कार्य पर स्थिर हो जाता है जिसे सुसंगत शैली की आवश्यकता होती है।

लेबल किए गए उदाहरणों पर एक सॉफ्ट प्रॉम्प्ट (ट्यून किया गया वेक्टर) सीखने के लिए Tuning Studio में prompt tuning चलाएँ।

क्यों: Prompt tuning आधार भार को बदले बिना व्यवहार को अनुकूलित करता है — fine-tuning से सस्ता, लंबे प्रॉम्प्ट की तुलना में अधिक विश्वसनीय।

संदर्भ

मॉडल में अद्यतन, तथ्यात्मक एंटरप्राइज़ ज्ञान की कमी है।

उन तथ्यों पर मॉडल को ट्यून करने के बजाय पुनर्प्राप्त दस्तावेजों में उत्तरों को आधार बनाने के लिए RAG का उपयोग करें।

क्यों: Tuning शैली/व्यवहार सिखाता है, न कि ताज़ा तथ्य; RAG वर्तमान आधारित संदर्भ को इंजेक्ट करता है और अपडेट करना आसान है।

एक सहयोगी-स्तर के watsonx प्रोजेक्ट के लिए prompt tuning और पूर्ण fine-tuning के बीच निर्णय लेना।

Prompt tuning को प्राथमिकता दें: यह बहुत कम मापदंडों को प्रशिक्षित करता है, तेजी से चलता है, और Tuning Studio में समर्थित मार्ग है।

क्यों: पूर्ण fine-tuning महंगा है, बड़े डेटासेट की आवश्यकता होती है, और विनाशकारी भूलने का जोखिम होता है; prompt tuning watsonx का डिफ़ॉल्ट है।

सारांश मॉडल को prompt-tune करने के लिए डेटा तैयार करना।

अपेक्षित JSON/JSONL प्रारूप में इनपुट/आउटपुट जोड़े प्रदान करें, उन्हें प्रशिक्षण और सत्यापन सेट में विभाजित करें।

क्यों: स्वच्छ, प्रतिनिधि जोड़े ट्यूनिंग गुणवत्ता को बढ़ाते हैं; सामान्यीकरण को पढ़ने के लिए एक अलग सत्यापन सेट की आवश्यकता होती है।

ट्यूनिंग लॉस कर्व जल्दी सपाट हो जाता है जबकि सत्यापन लॉस बढ़ने लगता है।

युगों को रोकें या कम करें — मॉडल प्रशिक्षण सेट पर ओवरफिट होना शुरू हो रहा है।

क्यों: विचलनकारी ट्रेन/सत्यापन लॉस क्लासिक ओवरफिट सिग्नल है; अधिक युग याद करेंगे, सामान्यीकरण नहीं करेंगे।

Prompt-tuning परिणाम रन भर में अस्थिर हैं।

ट्यूनिंग कॉन्फ़िग में सीखने की दर, युगों की संख्या, बैच आकार और वर्चुअल टोकन की संख्या समायोजित करें।

क्यों: बहुत अधिक सीखने की दर प्रशिक्षण को अस्थिर करती है; ये वे लीवर हैं जिन्हें Tuning Studio अभिसरण के लिए उजागर करता है।

दो प्रॉम्प्ट या ट्यून किए गए संपत्तियों की वस्तुनिष्ठ रूप से तुलना करने की आवश्यकता है।

कार्य मेट्रिक्स (जैसे सारांश के लिए ROUGE/BLEU, निष्कर्षण के लिए exact-match/F1) और मानव समीक्षा के साथ मूल्यांकन करें।

क्यों: उत्पादक गुणवत्ता बहु-आयामी है; स्वचालित मेट्रिक्स प्रतिगमन को पकड़ते हैं लेकिन मानव समीक्षा निष्ठा का न्याय करती है।

ट्यून किया गया मॉडल अभी भी ऐसे तथ्य गढ़ता है जो स्रोत में मौजूद नहीं हैं।

RAG के साथ आधार दें, तापमान कम करें, और मॉडल को केवल प्रदान किए गए संदर्भ से उत्तर देने या यह कहने का निर्देश दें कि उसे नहीं पता।

क्यों: मतिभ्रम एक भार समस्या से अधिक एक आधार और डिकोडिंग समस्या है; पुनर्प्राप्ति और बाधाएं इसका अधिकांश हिस्सा ठीक करती हैं।

अनुकूलन के लिए केवल कुछ दर्जन लेबल किए गए उदाहरण उपलब्ध हैं।

few-shot prompting या हल्के prompt tuning के साथ रहें; छोटे डेटा पर fine-tune न करें।

क्यों: छोटे डेटासेट पूर्ण fine-tuning के तहत बुरी तरह से ओवरफिट होते हैं; इन-संदर्भ उदाहरण उस पैमाने पर बेहतर सामान्यीकरण करते हैं।

वर्गीकरण कार्य के लिए किस आधार मॉडल को prompt-tune करना है, यह चुनना।

एक ट्यून करने योग्य Granite आधार मॉडल चुनें जिसे Tuning Studio prompt tuning के लिए समर्थन करता है, जो कार्य के आकार के अनुसार हो।

क्यों: हर कैटलॉग मॉडल ट्यून करने योग्य नहीं होता है; एक छोटे समर्थित मॉडल को ट्यून करना सस्ता है और अक्सर वर्गीकरण के लिए पर्याप्त होता है।

उत्पादन में जनरेटिव आउटपुट गुणवत्ता को लगातार ट्रैक किया जाना चाहिए।

परिनियोजन पर थ्रेशोल्ड और अलर्ट के साथ watsonx.governance बहाव और गुणवत्ता मॉनिटर कॉन्फ़िगर करें।

क्यों: शासन एक-एक मूल्यांकन को अलर्ट के साथ निगरानी वाले थ्रेशोल्ड में बदल देता है, न कि मैन्युअल स्पॉट चेक में।

वही ट्यून किया गया प्रॉम्प्ट विभिन्न क्षेत्रों के साथ कई इनपुट को सेवा प्रदान करना चाहिए।

नामित चर के साथ प्रॉम्प्ट टेम्पलेट को पैरामीटराइज़ करें और अनुमान समय पर मान प्रदान करें।

क्यों: चर इनपुट को हार्ड-कोडिंग करने के बजाय एक पुनः प्रयोज्य टेम्पलेट रखते हैं, और वे API मापदंडों के लिए स्पष्ट रूप से मैप करते हैं।

एक मॉडल कार्य निर्देश को अनदेखा करता है और केवल पाठ को जारी रखता है।

एक निर्देश-ट्यून किए गए मॉडल का उपयोग करें और प्रॉम्प्ट को एक स्पष्ट निर्देश के रूप में तैयार करें, न कि पूरा करने के लिए एक खंड के रूप में।

क्यों: बेस कंप्लीशन मॉडल पैटर्न-जारी रखते हैं; instruct मॉडल निर्देशों का पालन करने के लिए प्रशिक्षित होते हैं।

watsonx.data के साथ डेटा प्रबंधन

AI सुविधा तैयारी के लिए ऑब्जेक्ट-स्टोरेज डेटा पर इंटरैक्टिव SQL चलाने की आवश्यकता है।

ऑब्जेक्ट स्टोरेज में Iceberg तालिकाओं पर watsonx.data Presto इंजन का उपयोग करें।

क्यों: Presto डेटा को वेयरहाउस में कॉपी किए बिना ओपन टेबल प्रारूपों पर तेज़ फेडरेटेड SQL देता है।

संदर्भ

एनालिटिक्स डेटा को लेकहाउस पर स्कीमा विकास और टाइम-ट्रैवल की आवश्यकता है।

इसे watsonx.data द्वारा प्रबंधित Apache Iceberg तालिकाओं के रूप में संग्रहीत करें।

क्यों: Iceberg ऑब्जेक्ट स्टोरेज पर स्कीमा विकास, स्नैपशॉट और ACID संचालन का समर्थन करता है — लेकहाउस डिफ़ॉल्ट।

भारी ETL परिवर्तन बनाम एड-हॉक क्वेरी के लिए एक इंजन का चयन करना।

बड़े बैच परिवर्तन/ETL के लिए Spark का उपयोग करें; इंटरैक्टिव, कम-विलंबता SQL के लिए Presto का उपयोग करें।

क्यों: Spark बैच कंप्यूट को स्केल करता है; Presto तेज़ फेडरेटेड क्वेरींग के लिए अनुकूलित है — वर्कलोड आकार के अनुसार चुनें।

RAG को शासित डेटा के साथ सह-स्थित embeddings के लिए एक वेक्टर स्टोर की आवश्यकता है।

समानता खोज के लिए वेक्टर डेटाबेस के रूप में watsonx.data के अंदर Milvus को प्रावधानित करें।

क्यों: Milvus एकीकृत watsonx.data वेक्टर स्टोर है; लेकहाउस में embeddings रखने से शासन सरल हो जाता है।

संदर्भ

पुनर्प्राप्ति के लिए Milvus और watsonx Discovery के बीच निर्णय लेना।

अपने द्वारा नियंत्रित कच्चे वेक्टर समानता के लिए Milvus का उपयोग करें; हाइब्रिड पुनर्प्राप्ति के साथ प्रबंधित एंटरप्राइज़ खोज के लिए watsonx Discovery (Elasticsearch-आधारित) का उपयोग करें।

क्यों: Milvus एक वेक्टर DB है जिसे आप संचालित करते हैं; Discovery एक उच्च-स्तरीय खोज सेवा है जिसमें अंतर्ग्रहण और रैंकिंग अंतर्निहित है।

दस्तावेज़ों को तैयार करना ताकि एक फाउंडेशन मॉडल उन पर उत्तरों को आधार बना सके।

दस्तावेज़ों को खंडित करें, watsonx.ai embedding मॉडल के साथ embeddings उत्पन्न करें, और उन्हें Milvus में अनुक्रमित करें।

क्यों: पुनर्प्राप्ति गुणवत्ता समझदार चंकिंग और एक मिलान embedding मॉडल पर निर्भर करती है; बेमेल आयाम इंडेक्स को तोड़ते हैं।

AI सुविधा को कई डेटाबेस और बकेट में फैले डेटा की आवश्यकता है।

watsonx.data में स्रोतों को पंजीकृत करें और इंजन के फेडरेशन के माध्यम से उन्हें वहीं क्वेरी करें।

क्यों: फेडरेशन महंगी डेटा डुप्लीकेशन से बचाता है और एक एकल शासित एक्सेस पॉइंट रखता है।

शासन टीम को मॉडल को फ़ीड करने वाले डेटा पर वंश और पहुंच नियंत्रण की आवश्यकता है।

watsonx.data कैटलॉग में डेटासेट को कैटलॉग करें और IAM/नीति-आधारित पहुंच लागू करें।

क्यों: एक शासित कैटलॉग वह है जो डेटा वंश को बाद में मॉडल फैक्टशीट से जोड़ता है — एड-हॉक बकेट एक्सेस इसे बायपास करता है।

एक watsonx.ai प्रोजेक्ट को RAG के लिए क्यूरेटेड लेकहाउस तालिकाओं को पढ़ना चाहिए।

प्रोजेक्ट में एक watsonx.data कनेक्शन जोड़ें और तालिकाओं को डेटा संपत्ति के रूप में संदर्भित करें।

क्यों: कनेक्शन AI प्रोजेक्ट को शासित लेकहाउस डेटा को कॉपी निर्यात किए बिना उजागर करते हैं।

GenAI समाधानों को परिनियोजित करना और एकीकृत करना

एक काम करने वाला Prompt Lab प्रॉम्प्ट एक पुनः प्रयोज्य, परिनियोजित करने योग्य संपत्ति बनना चाहिए।

इसे प्रोजेक्ट में एक प्रॉम्प्ट टेम्पलेट संपत्ति के रूप में सहेजें, फिर इसे परिनियोजन स्थान पर प्रचारित करें।

क्यों: परिनियोजन स्थान उत्पादन सीमा हैं; प्रॉम्प्ट को सेवा प्रदान करने से पहले वहां प्रचारित किया जाना चाहिए।

एक एप्लिकेशन को एक ट्यून किए गए प्रॉम्प्ट के लिए कम-विलंबता अनुमान एंडपॉइंट की आवश्यकता है।

परिनियोजन स्थान में एक ऑनलाइन परिनियोजन बनाएँ; यह एक स्कोरिंग/उत्पादन REST एंडपॉइंट को उजागर करता है।

क्यों: ऑनलाइन परिनियोजन एक सिंक्रोनस एंडपॉइंट देते हैं; बैच परिनियोजन ऑफ़लाइन स्कोरिंग नौकरियों के लिए होते हैं।

संदर्भ

Python एप्लिकेशन कोड से एक फाउंडेशन मॉडल को कॉल करना।

watsonx.ai Python SDK ModelInference क्लास का उपयोग करें और अपने मापदंडों के साथ generate_text को कॉल करें।

क्यों: ModelInference प्रमाणीकरण, मॉडल आईडी, प्रोजेक्ट/स्पेस और मापदंडों को एक क्लाइंट में लपेटता है — कच्चे REST से अधिक स्वच्छ।

संदर्भ

एक गैर-Python सेवा को watsonx.ai अनुमान को कॉल करना होगा।

JSON बॉडी में मॉडल आईडी, इनपुट और मापदंडों के साथ watsonx.ai टेक्स्ट-जनरेशन REST एंडपॉइंट को कॉल करें।

क्यों: REST API भाषा-अज्ञेयवादी है; SDK उन्हीं एंडपॉइंट्स पर एक रैपर मात्र है।

watsonx.ai पर SDK या API कॉल को प्रमाणित करना।

एक IBM Cloud IAM API कुंजी को एक बियरर टोकन के लिए बदलें, फिर उस टोकन और अपनी प्रोजेक्ट/स्पेस आईडी के साथ एंडपॉइंट को कॉल करें।

क्यों: watsonx IBM Cloud IAM का उपयोग करता है; प्रत्येक कॉल पर कच्ची API कुंजी को एम्बेड करना या टोकन को हार्ड-कोड करना गलत और असुरक्षित है।

संदर्भ

विकास बनाम सेवा के दौरान एक मॉडल संपत्ति कहाँ रहती है, यह तय करना।

एक प्रोजेक्ट में विकसित और प्रयोग करें; संपत्ति को सेवा प्रदान करने के लिए एक परिनियोजन स्थान पर प्रचारित करें।

क्यों: प्रोजेक्ट सहयोगी देव सैंडबॉक्स हैं; परिनियोजन स्थान उत्पादन-प्रचारित, पहुंच-नियंत्रित संपत्तियों को रखते हैं।

पुनर्प्राप्ति और उत्पादन को एक एप्लिकेशन प्रवाह में जोड़ना।

क्वेरी को एम्बेड करें, Milvus/Discovery से top-k चंक पुनर्प्राप्त करें, उन्हें प्रॉम्प्ट टेम्पलेट में इंजेक्ट करें, फिर परिनियोजित मॉडल को कॉल करें।

क्यों: पुनर्प्राप्त करें-फिर-उत्पन्न करें क्रम ही उत्तर को आधार बनाता है; पहले मॉडल को कॉल करना RAG को हरा देता है।

watsonx प्लेटफ़ॉर्म अवलोकन और वास्तुकला

एक GenAI वर्कलोड को watsonx उत्पाद परिवार में मैप करना।

watsonx.ai में निर्माण और ट्यून करें, watsonx.data में डेटा संग्रहीत/क्वेरी करें, watsonx.governance में शासन और निगरानी करें।

क्यों: तीनों घटक पूरक हैं, विनिमेय नहीं — यह जानना कि कौन क्या करता है, मुख्य परीक्षा ज्ञान है।

संदर्भ

डेटा-रेसिडेंसी कारणों से एंटरप्राइज़ को ऑन-प्रेम watsonx की आवश्यकता है।

IBM Cloud SaaS पेशकश के बजाय Cloud Pak for Data (Red Hat OpenShift) पर watsonx को सॉफ़्टवेयर के रूप में परिनियोजित करें।

क्यों: SaaS IBM Cloud में चलता है; सॉफ़्टवेयर फॉर्म फैक्टर आपकी अपनी OpenShift क्लस्टर में निवास/एयर-गैप आवश्यकताओं के लिए चलता है।

सहयोगी GenAI कार्य और उसकी कलाकृतियों को व्यवस्थित करना।

एक watsonx प्रोजेक्ट का उपयोग कार्यक्षेत्र के रूप में करें जो साझा पहुंच के साथ डेटा संपत्ति, नोटबुक, प्रॉम्प्ट और ट्यून किए गए मॉडल रखता है।

क्यों: प्रोजेक्ट सहयोग और संपत्ति स्कोपिंग की इकाई हैं; परिनियोजन स्थान अलग और उत्पादन-उन्मुख हैं।

यह नियंत्रित करना कि कौन से watsonx उदाहरणों और संपत्तियों तक कौन पहुंच सकता है।

पहुंच को दायरे में रखने के लिए IBM Cloud खातों, संसाधन समूहों और IAM पहुंच नीतियों/भूमिकाओं का उपयोग करें।

क्यों: watsonx में पहुंच खाता/संसाधन-समूह स्तर पर IAM-संचालित है — न कि केवल प्रति-संपत्ति साझाकरण।

फाउंडेशन-मॉडल अनुमान चलाने की लागत का अनुमान लगाना।

watsonx.ai अनुमान पर टोकन-आधारित बिलिंग के साथ-साथ watsonx.data में प्रावधानित इंजन/स्टोरेज का हिसाब रखें।

क्यों: GenAI लागत इनपुट/आउटपुट टोकन से हावी होती है; लेकहाउस और वेक्टर-स्टोर कंप्यूट अलग-अलग लाइन आइटम हैं।

watsonx पर एक उत्पादन RAG वास्तुकला का स्केच बनाना।

लेकहाउस डेटा → Milvus में embeddings → watsonx.ai पुनर्प्राप्ति + उत्पादन → ऐप, जिसमें पूरे समय watsonx.governance निगरानी शामिल है।

क्यों: यह एंड-टू-एंड प्रवाह प्रामाणिक watsonx संदर्भ पैटर्न है जिसे परीक्षा में पहचानने की अपेक्षा की जाती है।

शासन, अनुपालन और जिम्मेदार AI

ऑडिटर एक परिनियोजित मॉडल के जीवनचक्र और स्रोत का रिकॉर्ड मांगते हैं।

जीवनचक्र भर में मॉडल मेटाडेटा, वंश और अनुमोदन को कैप्चर करने के लिए watsonx.governance AI factsheets का उपयोग करें।

क्यों: फैक्टशीट मॉडल के स्रोत के लिए watsonx की रिकॉर्ड प्रणाली हैं — "यह मॉडल कहाँ से आया" का दस्तावेजित उत्तर।

संदर्भ

एक उत्पादन मॉडल का आउटपुट समय के साथ खराब होता जाता है।

परिनियोजन पर थ्रेशोल्ड और अलर्ट के साथ watsonx.governance बहाव और गुणवत्ता मॉनिटर कॉन्फ़िगर करें।

क्यों: निरंतर निगरानी उपयोगकर्ताओं से पहले बहाव को पकड़ती है; एक बार का सत्यापन परिनियोजन के बाद के क्षय का पता नहीं लगा सकता है।

एक मॉडल को संरक्षित समूहों में अनुचित व्यवहार के लिए जाँच की जानी चाहिए।

watsonx.governance में निष्पक्षता/पूर्वाग्रह मूल्यांकन चलाएँ और तथ्यपत्र में शमन का दस्तावेजीकरण करें।

क्यों: जिम्मेदार-AI दायित्वों को मापी गई, रिकॉर्ड की गई निष्पक्षता की आवश्यकता होती है — न कि केवल निष्पक्षता की एक अनुमापित धारणा की।

अनुपालन टीम को GenAI सिस्टम को AI विनियमों से मैप करने की आवश्यकता है।

जोखिम को ट्रैक करने, नियंत्रणों को विनियमों से जोड़ने और ऑडिट-तैयार साक्ष्य बनाए रखने के लिए watsonx.governance का उपयोग करें।

क्यों: शासन मॉडल जोखिम को एक ही स्थान पर नियामक नियंत्रणों से जोड़ता है, जिसकी ऑडिट और IBM जिम्मेदार-AI सिद्धांतों को आवश्यकता होती है।