🏠होम 📚सर्टिफिकेशन 📱मोबाइल ऐप्स

🎓परीक्षा जानकारी

✍️ब्लॉग 📊प्रगति 📅कैलेंडर 💬सहायता

गोपनीयता नीति उपयोग की शर्तें हमसे संपर्क करें कुकी नीति अस्वीकरण सुगम्यता DMCA / कॉपीराइट

सामग्री पर जाएँ

AIF-C01मार्गदर्शिका

मार्गदर्शिका

AWS Certified AI Practitioner

अंतिम समीक्षा: अप्रैल 2026

AIF-C01 परीक्षा द्वारा परखे जाने वाले architectural patterns का स्कैन-योग्य संदर्भ। ऊपर से नीचे पढ़ें या किसी section पर जाएं।

अनुभाग

AI और ML के मूल सिद्धांत11 प्रविष्टियां
जेनरेटिव AI के मूल सिद्धांत14 प्रविष्टियां
फाउंडेशन मॉडल के अनुप्रयोग14 प्रविष्टियां
जिम्मेदार AI के लिए दिशानिर्देश7 प्रविष्टियां
AI समाधानों के लिए सुरक्षा, अनुपालन और शासन9 प्रविष्टियां

AI और ML के मूल सिद्धांत

एक लर्निंग प्रतिमान चुनें: लेबल किया गया डेटा, अनलेबल किया गया डेटा, या इंटरैक्टिव ट्रायल-एंड-एरर।

लेबल किया गया → सुपरवाइज्ड। अनलेबल किया गया क्लस्टरिंग/सेगमेंटेशन → अनसुपरवाइज्ड। एजेंट रिवॉर्ड से सीखता है → रीइन्फोर्समेंट।

क्यों: चुनाव मौजूदा डेटा द्वारा निर्धारित होता है। RLHF मानव रेटिंग द्वारा निर्देशित रीइइन्फोर्समेंट लर्निंग है, जिसका उपयोग LLM को संरेखित करने के लिए किया जाता है।

संदर्भ

एक नए संबंधित कार्य के लिए एक प्री-ट्रेन्ड मॉडल को शुरू से प्रशिक्षण देने के बजाय अनुकूलित करें।

ट्रांसफर लर्निंग का उपयोग करें। मौजूदा मॉडल को नए डोमेन डेटासेट पर फाइन-ट्यून करें।

क्यों: सीखे गए प्रतिनिधित्वों का पुन: उपयोग करता है, शुरू से मॉडल बनाने की तुलना में प्रशिक्षण समय और डेटा की आवश्यकताओं को कम करता है।

वर्कलोड के आकार के लिए एक SageMaker इनफरेंस मोड चुनें।

स्थिर कम-विलंबता → रियल-टाइम। स्पाइकी/निष्क्रिय ट्रैफ़िक → सर्वरलेस। बड़े पेलोड (≤1 GB) या लंबे कार्य (≤1 घंटा) निकट-रियल-टाइम के साथ → एसिंक्रोनस। ऑफ़लाइन बल्क → बैच ट्रांसफॉर्म।

क्यों: रियल-टाइम में पेलोड/टाइमआउट सीमाएँ होती हैं; async बड़े कार्यों को कतारबद्ध करता है; बैच आवधिक ऑफ़लाइन स्कोरिंग के लिए है।

संदर्भ

कई ML टीमों को इंजीनियर की गई सुविधाओं को साझा करने और उनका पुन: उपयोग करने की आवश्यकता है।

ऑनलाइन + ऑफ़लाइन सुविधाओं के लिए केंद्रीय रेपो के रूप में Amazon SageMaker Feature Store।

क्यों: डुप्लिकेट फीचर इंजीनियरिंग से बचाता है और टीमों में ट्रेन/सर्व सुसंगतता बनाए रखता है।

संदर्भ

कोडिंग या ML विशेषज्ञता के बिना ML मॉडल बनाएं (उदाहरण के लिए विश्लेषकों के लिए मांग पूर्वानुमान)।

Amazon SageMaker Canvas — प्रशिक्षण और इनफरेंस के लिए दृश्य नो-कोड इंटरफ़ेस।

संदर्भ

एक VPC के भीतर एक फाउंडेशन मॉडल को तेजी से डिप्लॉय करें।

Amazon SageMaker JumpStart — प्री-ट्रेन्ड मॉडल आपके VPC में SageMaker एंडपॉइंट्स के रूप में डिप्लॉय होते हैं।

क्यों: JumpStart वन-क्लिक VPC-बाउंड डिप्लॉयमेंट के लिए मॉडल आर्टिफैक्ट्स और नोटबुक्स को बंडल करता है।

संदर्भ

हाइपरपैरामीटर ट्यूनिंग और मॉडल चयन को स्वचालित करें।

Amazon SageMaker Autopilot — एल्गोरिदम की पड़ताल करता है और हाइपरपैरामीटर को स्वचालित रूप से ट्यून करता है।

संदर्भ

एक वर्गीकरण मॉडल के लिए सही मूल्यांकन मीट्रिक चुनें।

छवि/बाइनरी वर्गीकरण की शुद्धता → एक्यूरेसी। क्लास ब्रेकडाउन → कन्फ्यूजन मैट्रिक्स। असंतुलित क्लास → F1, प्रिसिजन, रिकॉल। थ्रेशोल्ड-स्वतंत्र → AUC।

क्यों: असंतुलित डेटा पर एक्यूरेसी भ्रामक होती है; कन्फ्यूजन मैट्रिक्स TP/FP/TN/FN की गिनती दिखाता है; F1 प्रिसिजन और रिकॉल को संतुलित करता है।

एक सकारात्मक (गलत नकारात्मक) को मिस करने की लागत गलत सकारात्मक से कहीं अधिक है — उदा. धोखाधड़ी का पता लगाना, बीमारी की जांच।

रिकॉल (संवेदनशीलता) के लिए अनुकूलन करें। कम प्रिसिजन स्वीकार करें।

क्यों: रिकॉल = TP / (TP + FN)। इसे अधिकतम करने से अधिक गलत अलार्म की कीमत पर छूटे हुए सकारात्मक कम होते हैं।

मॉडल प्रशिक्षण डेटा पर उच्च स्कोर करता है लेकिन परीक्षण/उत्पादन डेटा पर खराब प्रदर्शन करता है; या सटीकता पहले बेहतर होती है फिर जैसे-जैसे युग बढ़ते हैं, खराब होती जाती है।

ओवरफिटिंग। अधिक डेटा, रेगुलराइज़ेशन, अर्ली स्टॉपिंग, ड्रापआउट, या सरल मॉडल के साथ कम करें।

क्यों: ट्रेन-बनाम-परीक्षण में बड़ा अंतर का मतलब है कि मॉडल ने पैटर्न सीखने के बजाय शोर को याद कर लिया।

एक एकल-उद्देश्य कार्य के लिए प्रबंधित AI सेवा चुनें।

NLP/भावना/इकाइयां → Comprehend। स्पीच-टू-टेक्स्ट → Transcribe। टेक्स्ट-टू-स्पीच → Polly। अनुवाद → Translate। चैटबॉट/वॉयस UI → Lex। छवि/वीडियो → Rekognition। दस्तावेज़/PDF टेक्स्ट एक्सट्रैक्शन → Textract। सिफारिशें → Personalize। पूर्वानुमान → Forecast।

क्यों: प्रबंधित AI सेवाएँ कस्टम मॉडल को तब बेहतर बनाती हैं जब कार्य अच्छी तरह से दायरे में होता है और कैटलॉग पर होता है।

संदर्भ

जेनरेटिव AI के मूल सिद्धांत

मॉडल इंफ्रास्ट्रक्चर का प्रबंधन किए बिना AWS पर एक जेनरेटिव AI एप्लिकेशन बनाएं।

Amazon Bedrock — एक एकल API के माध्यम से फाउंडेशन मॉडल (Anthropic Claude, Meta Llama, Amazon Titan, Stability, AI21, Mistral, Cohere) तक पूरी तरह से प्रबंधित पहुँच।

क्यों: कोई GPU प्रावधान नहीं, कोई मॉडल होस्टिंग नहीं; प्रति टोकन भुगतान करें। SageMaker JumpStart एक विकल्प है जब आपको अपने VPC में एक सेल्फ-होस्टेड एंडपॉइंट की आवश्यकता होती है।

संदर्भ

परिभाषित करें कि क्या एक मॉडल को "फाउंडेशन मॉडल" बनाता है।

विविध, ज्यादातर अनलेबल किए गए डेटा पर प्री-ट्रेन्ड बड़ा मॉडल; प्रॉम्प्टिंग, फाइन-ट्यूनिंग, या RAG के माध्यम से कई डाउनस्ट्रीम कार्यों के लिए अनुकूलनीय।

अनुमान लगाएं कि एक प्रॉम्प्ट में कितना इनपुट फिट होता है और इनफरेंस लागत क्या निर्धारित करती है।

टोकन उप-शब्द इकाइयां हैं। संदर्भ विंडो = प्रति अनुरोध अधिकतम टोकन (इनपुट + आउटपुट)। इनफरेंस लागत संसाधित टोकन के लगभग आनुपातिक होती है।

क्यों: टोकन की संख्या, अनुरोधों की संख्या नहीं, Bedrock की कीमत तय करती है। यदि कोई लंबा दस्तावेज़ संदर्भ विंडो से अधिक है, तो उसे खंडों में तोड़ें या बड़े विंडो वाले मॉडल का चयन करें।

आउटपुट शैली चुनें: नियतात्मक बनाम रचनात्मक।

कम तापमान (~0.0–0.3) → नियतात्मक, दोहराने योग्य। उच्च तापमान (~0.7–1.0) → रचनात्मक, विविध। सुसंगत लेबल प्राप्त करने के लिए वर्गीकरण या भावना के लिए 0 का उपयोग करें।

तापमान से परे उम्मीदवार टोकन पूल को प्रतिबंधित करें।

Top-K = केवल K सबसे संभावित टोकन पर विचार करें। Top-P (न्यूक्लियस) = टोकन पर तब तक विचार करें जब तक संचयी संभावना P तक न पहुँच जाए।

क्यों: Top-P उम्मीदवार सेट के आकार को वितरण के आकार के अनुकूल बनाता है; Top-K निश्चित-चौड़ाई का होता है।

एक विशिष्ट शैली, लंबाई, या भाषा में LLM आउटपुट प्राप्त करें।

प्रॉम्प्ट इंजीनियरिंग। स्पष्ट निर्देश जोड़ें ("फ्रेंच में जवाब दें, 50 शब्दों से कम में, औपचारिक लहजे में")।

क्यों: स्टाइलिश नियंत्रण के लिए फाइन-ट्यूनिंग, रिट्रेनिंग, या मॉडल आकार बदलने की तुलना में सस्ता और तेज़।

पुनः प्रशिक्षण के बिना एक विशिष्ट कार्य पर LLM सटीकता में सुधार करें।

फ़्यू-शॉट प्रॉम्प्टिंग — नए इनपुट से पहले प्रॉम्प्ट में 2–5 लेबल किए गए इनपुट/आउटपुट उदाहरण एम्बेड करें।

क्यों: इन-कॉन्टेक्स्ट लर्निंग मॉडल को बिना वेट अपडेट के उदाहरणों के विरुद्ध पैटर्न-मैच करने की सुविधा देता है।

LLM बहु-चरणीय तर्क समस्याओं पर गलत उत्तर देता है।

चेन-ऑफ-थॉट प्रॉम्प्टिंग — मॉडल को अंतिम उत्तर से पहले तर्क चरणों से गुजरने का निर्देश दें ("आइए कदम-दर-कदम सोचें")।

LLM ऐसा टेक्स्ट उत्पन्न करता है जो प्रशंसनीय लगता है लेकिन तथ्यात्मक रूप से गलत या गढ़ा हुआ है।

मतिभ्रम। RAG (पुनर्प्राप्त तथ्यों पर आधारित), Bedrock Guardrails, कम तापमान, और उच्च-दांव वाले आउटपुट की मानवीय समीक्षा के साथ कम करें।

टेक्स्ट या मल्टीमॉडल डेटा पर सिमेंटिक सर्च, क्लस्टरिंग, या RAG रिट्रीवल को शक्ति दें।

कंटेंट को घने वैक्टर में बदलने के लिए एक एम्बेडिंग मॉडल (जैसे Titan Embeddings, Cohere Embed) का उपयोग करें। एक वेक्टर DB में स्टोर और क्वेरी करें।

क्यों: एम्बेडिंग सिमेंटिक अर्थ को कैप्चर करते हैं ताकि समान आइटम वेक्टर स्पेस में एक-दूसरे के करीब आ जाएं (कोसाइन / डॉट-प्रोडक्ट समानता)।

संदर्भ

सर्च एप्लिकेशन टेक्स्ट और छवियों दोनों को इनपुट के रूप में स्वीकार करता है।

मल्टीमॉडल एम्बेडिंग मॉडल (जैसे Titan Multimodal Embeddings) — टेक्स्ट और छवियों को एक ही वेक्टर स्पेस में प्रोजेक्ट करता है।

संदर्भ

बिना कोड या AWS खाता सेटअप के एक जेनरेटिव AI ऐप को तेजी से प्रोटोटाइप करें।

PartyRock (Amazon Bedrock Playground) — ब्राउज़र-आधारित नो-कोड ऐप बिल्डर।

संदर्भ

एक Bedrock मूल्य निर्धारण मॉडल चुनें।

परिवर्तनीय / अप्रत्याशित लोड → ऑन-डिमांड (प्रति-टोकन)। स्थिर उच्च-मात्रा या गारंटीकृत थ्रूपुट → प्रोविजन्ड थ्रूपुट। कस्टम फाइन-ट्यून किए गए मॉडल → को प्रोविजन्ड थ्रूपुट का उपयोग करना चाहिए।

क्यों: ऑन-डिमांड में कोई प्रतिबद्धता नहीं है; प्रोविजन्ड थ्रूपुट मॉडल इकाइयों में समर्पित क्षमता खरीदता है।

संदर्भ

सबसे सस्ता कस्टमाइज़ेशन चुनें जो आपको आवश्यक गुणवत्ता प्रदान करता है।

इस क्रम में प्रयास करें: (1) प्रॉम्प्ट इंजीनियरिंग, (2) एक ज्ञान आधार के साथ RAG, (3) फाइन-ट्यूनिंग, (4) निरंतर प्री-ट्रेनिंग।

क्यों: हर कदम पर प्रयास और लागत बढ़ती है। पहली बाधा को पूरा करने वाले पर रुकें।

फाउंडेशन मॉडल के अनुप्रयोग

फाइन-ट्यूनिंग के बिना एक फाउंडेशन मॉडल को निजी कंपनी डेटा (PDF, दस्तावेज़, S3 सामग्री) के साथ बढ़ाएँ।

एक Amazon Bedrock Knowledge Base बनाएँ। Bedrock इनफरेंस समय पर इनजेस्शन, चंकिंग, एम्बेडिंग और रिट्रीवल (RAG) को संभालता है।

क्यों: फाइन-ट्यूनिंग की तुलना में अपडेट करना सस्ता और तेज़। स्रोत डेटा बदलता है → KB को फिर से सिंक करें; कोई पुनः प्रशिक्षण नहीं।

संदर्भ

डेटा बार-बार बदलता है (इन्वेंट्री, मूल्य निर्धारण, समाचार) और मॉडल को वर्तमान स्थिति को प्रतिबिंबित करना चाहिए।

एक ज्ञान आधार के साथ RAG। फाइन-ट्यूनिंग से बचें — पुनः प्रशिक्षण चक्र गति नहीं रख सकते।

क्यों: RAG मॉडल को डेटा से अलग करता है; KB मॉडल से स्वतंत्र रूप से अपडेट होता है।

एक विशिष्ट कार्य के लिए लेबल किए गए उदाहरणों के साथ एक फाउंडेशन मॉडल को फाइन-ट्यून करें।

प्रॉम्प्ट-कंप्लीशन (निर्देश-प्रतिक्रिया) जोड़े प्रदान करें। JSONL प्रारूप मानक है।

क्यों: निर्देश फाइन-ट्यूनिंग मॉडल को लक्ष्य कार्य में उपयोगकर्ता इनपुट को वांछित आउटपुट से मैप करना सिखाता है।

संदर्भ

बहुत सारे अनलेबल किए गए डोमेन टेक्स्ट का उपयोग करके एक फाउंडेशन मॉडल को विशेष शब्दावली (चिकित्सा, कानूनी, वैज्ञानिक) सिखाएं।

अनलेबल किए गए डोमेन कॉर्पस पर निरंतर प्री-ट्रेनिंग।

क्यों: निरंतर प्री-ट्रेनिंग मॉडल की शब्दावली और अवधारणाओं की समझ को अपडेट करता है; निर्देश फाइन-ट्यूनिंग कार्य व्यवहार सिखाता है। अलग लक्ष्य, अलग डेटा आकार।

संदर्भ

बहु-चरणीय वर्कफ़्लो जो LLM तर्क को बाहरी API, डेटाबेस, या AWS सेवाओं के कॉल के साथ जोड़ता है।

Amazon Bedrock Agents — एक एकल प्रबंधित रनटाइम में LLM तर्क, टूल/API इनवोकेशन, और परिणाम संश्लेषण का समन्वय करता है।

क्यों: एजेंट चरणों की योजना बनाते हैं, टूल को कॉल करते हैं, और परिणामों को अंतिम प्रतिक्रिया में वापस जोड़ते हैं, बिना आपको ऑर्केस्ट्रेशन लूप लिखे।

संदर्भ

एम्बेडिंग के लिए एक वेक्टर डेटाबेस चुनें।

प्रबंधित RAG → Bedrock नॉलेज बेस (वेक्टर स्टोर को स्वचालित रूप से संभालता है)। कस्टम वेक्टर DB → OpenSearch Service (k-NN), pgvector के साथ Aurora PostgreSQL, Neptune Analytics, या pgvector के साथ RDS for PostgreSQL।

क्यों: OpenSearch उच्च-मात्रा k-NN के लिए डिफ़ॉल्ट है; pgvector एक मौजूदा संबंधपरक DB का पुन: उपयोग करता है।

संदर्भ

उत्पादन सेवा के लिए Bedrock से एक फाइन-ट्यून किया गया मॉडल डिप्लॉय करें।

कस्टम Bedrock मॉडल के लिए प्रोविजन्ड थ्रूपुट खरीदें। कस्टम मॉडल को ऑन-डिमांड मूल्य निर्धारण के माध्यम से इनवोक नहीं किया जा सकता है।

क्यों: कस्टम-मॉडल क्षमता समर्पित है, मॉडल इकाइयों में बिल की जाती है, और इनवोकेशन के लिए आवश्यक है।

संदर्भ

Bedrock इनफरेंस लागत का अनुमान लगाएं या कम करें।

लागत ≈ संसाधित टोकन × प्रति-टोकन दर। प्रॉम्प्ट को छोटा करके, फ़्यू-शॉट उदाहरणों को ट्रिम करके, छोटे मॉडल चुनकर, या जहाँ समर्थित हो वहाँ प्रॉम्प्ट कैशिंग का उपयोग करके कम करें।

संदर्भ

मानव-इन-द-लूप समीक्षा के साथ उच्च-सटीकता वाला लेबल किया गया डेटा उत्पन्न करें (जैसे विशेष छवियां, मेडिकल रिकॉर्ड)।

Amazon SageMaker Ground Truth Plus — प्रबंधित HITL लेबलिंग कार्यबल।

क्यों: कम-विश्वास वाले मॉडल भविष्यवाणियों के आवधिक ऑडिटिंग के लिए, Amazon A2I (Augmented AI) के साथ युग्मित करें।

संदर्भ

भाषण पहचान डोमेन-विशिष्ट शब्दों (चिकित्सा, कानूनी, ब्रांड नाम) को गलत सुनती है।

डोमेन टेक्स्ट पर प्रशिक्षित एक कस्टम भाषा मॉडल या कस्टम शब्दावली के साथ Amazon Transcribe।

संदर्भ

मॉडल प्रशिक्षण पर अच्छा प्रदर्शन करता है लेकिन उत्पादन में खराब (ओवरफिट) — आर्किटेक्चर को बदले बिना सामान्यीकरण बढ़ाएं।

प्रशिक्षण डेटा की मात्रा और विविधता बढ़ाएँ। डेटा न काटें या केवल हाइपरपैरामीटर न जोड़ें।

क्यों: अधिक प्रतिनिधि डेटा उच्चतम-लीवरेज फिक्स है; रेगुलराइज़ेशन और अर्ली स्टॉपिंग मदद करते हैं लेकिन डेटा हावी होता है।

जेनरेटिव आउटपुट गुणवत्ता का मूल्यांकन करें।

अनुवाद गुणवत्ता → BLEU। सारांश गुणवत्ता → ROUGE। संदर्भ से सिमेंटिक समानता → BERTScore। शैलीगत प्राथमिकता → कस्टम प्रॉम्प्ट सेट के साथ मानव मूल्यांकन।

एक उपयोग के मामले के लिए एक Bedrock फाउंडेशन मॉडल चुनें जहां आउटपुट शैली मायने रखती है।

उम्मीदवार मॉडल के लिए एक कस्टम प्रॉम्प्ट डेटासेट पर मानव मूल्यांकन चलाएं। केवल सार्वजनिक लीडरबोर्ड या विलंबता मेट्रिक्स पर निर्भर न रहें।

क्यों: शैली/स्वर की उपयुक्तता व्यक्तिपरक है; बेंचमार्क इसे मिस करते हैं।

संदर्भ

व्यवसाय डेटा पर प्राकृतिक-भाषा के प्रश्नों से चार्ट और डैशबोर्ड उत्पन्न करें।

QuickSight में Amazon Q — QuickSight डेटासेट पर प्राकृतिक-भाषा BI।

संदर्भ

जिम्मेदार AI के लिए दिशानिर्देश

प्रशिक्षण डेटा या मॉडल भविष्यवाणियों में पूर्वाग्रह का पता लगाएं; व्याख्यात्मक रिपोर्ट तैयार करें।

Amazon SageMaker Clarify। प्रशिक्षण से पहले और बाद में संरक्षित विशेषताओं में पूर्वाग्रह मेट्रिक्स चलाता है, साथ ही SHAP-आधारित फीचर एट्रिब्यूशन भी।

क्यों: नियामित डोमेन (उधार, भर्ती, स्वास्थ्य सेवा) के लिए आवश्यक है जहां आपको निष्पक्षता और व्याख्यात्मकता प्रदर्शित करनी होगी।

संदर्भ

मॉडल एक जनसांख्यिकी, जातीय समूह, या भूगोल के लिए खराब प्रदर्शन करता है (उदाहरण के लिए कुछ समूहों को असमान रूप से चिह्नित करता है)।

सैंपलिंग पूर्वाग्रह। डेटासेट को पुनर्संतुलित करें: अविकसित वर्गों के लिए डेटा ऑग्मेंटेशन; विविध, प्रतिनिधि स्रोतों को सुनिश्चित करें।

क्यों: प्रशिक्षण डेटा जो समूहों का प्रतिनिधित्व कम करता है, ऐसे मॉडल उत्पन्न करता है जो उन्हें कम सेवा प्रदान करते हैं। इसे डेटा परत पर ठीक करें, मॉडल परत पर नहीं।

शासन और ऑडिट के लिए एक मॉडल के इच्छित उपयोग, प्रशिक्षण डेटा, प्रदर्शन, सीमाओं और जोखिमों का दस्तावेजीकरण करें।

Amazon SageMaker Model Cards — मॉडल से जुड़ा संरचित, संस्करणित दस्तावेज़।

संदर्भ

LLM विषयों को प्रतिबंधित करें, हानिकारक सामग्री को फ़िल्टर करें, PII को मास्क करें, या प्रॉम्प्ट इंजेक्शन पैटर्न को ब्लॉक करें।

Amazon Bedrock Guardrails। अस्वीकृत विषयों, सामग्री फिल्टर (घृणा, हिंसा, यौन, अपमान), शब्द फिल्टर, संवेदनशील-जानकारी फिल्टर, और प्रासंगिक ग्राउंडिंग जांच को कॉन्फ़िगर करें।

क्यों: इनपुट और आउटपुट दोनों पर लागू होता है; किसी भी Bedrock मॉडल और आपके अपने कस्टम मॉडल पर काम करता है।

संदर्भ

जेनरेटिव AI डिप्लॉयमेंट के लिए कंपनी की सुरक्षा जिम्मेदारी का हिस्सा निर्धारित करें।

AWS जेनरेटिव AI सिक्योरिटी स्कोप मैट्रिक्स। स्कोप 1 (उपभोक्ता ऐप, सबसे कम जिम्मेदारी) → स्कोप 5 (स्व-प्रशिक्षित मॉडल, उच्चतम जिम्मेदारी)।

क्यों: निजी डेटा पर शुरू से एक मॉडल का निर्माण और प्रशिक्षण कंपनी पर अधिकतम सुरक्षा जिम्मेदारी डालता है।

संदर्भ

हितधारकों या नियामकों को एक स्पष्टीकरण की आवश्यकता होती है कि मॉडल अपनी भविष्यवाणियों तक कैसे पहुँचता है।

जब संभव हो तो व्याख्यात्मक मॉडल का उपयोग करें (निर्णय वृक्ष, रैखिक/लॉजिस्टिक्स रिग्रेशन)। जटिल मॉडल के लिए, SageMaker Clarify के माध्यम से आंशिक निर्भरता प्लॉट, SHAP फीचर महत्व, या SageMaker मॉडल कार्ड का उपयोग करें।

क्यों: PDPs प्रत्येक सुविधा का सीमांत प्रभाव दिखाते हैं; SHAP प्रति भविष्यवाणी योगदान को बताता है; मॉडल कार्ड ऑडिट के लिए पूरी कहानी को कैप्चर करते हैं।

जेनरेटिव AI आउटपुट कॉपीराइट सामग्री को पुन: प्रस्तुत कर सकता है या मानव-लिखित कार्य के रूप में प्रस्तुत किया जा सकता है।

साहित्यिक चोरी / IP-उल्लंघन का जोखिम। उद्धरण आवश्यकताओं, सामग्री के स्रोत ट्रैकिंग, जहाँ समर्थित हो वहाँ वॉटरमार्किंग, मानवीय समीक्षा, और स्पष्ट AI-सामग्री प्रकटीकरण नीतियों के साथ कम करें।

AI समाधानों के लिए सुरक्षा, अनुपालन और शासन

फाउंडेशन-मॉडल ऐप को प्रॉम्प्ट और प्रतिक्रियाओं को AWS नेटवर्क पर रखना चाहिए — कोई सार्वजनिक इंटरनेट बहिर्गमन नहीं।

रनटाइम API के लिए VPC एंडपॉइंट्स (PrivateLink) के साथ Bedrock। संगठन स्तर पर SCPs के साथ सार्वजनिक Bedrock एंडपॉइंट्स को ब्लॉक करें।

क्यों: PrivateLink अनुरोधों को निजी रखता है और VPC से डेटा के बाहर निकलने से बचाता है; SCPs सभी खातों में नियम लागू करते हैं।

संदर्भ

कई टीमें साझा S3 डेटा के विरुद्ध Bedrock को कॉल करती हैं; प्रत्येक टीम को केवल अपने स्वयं के ग्राहक डेटा तक पहुंच होनी चाहिए।

प्रति टीम एक IAM सेवा भूमिका बनाएँ जो Bedrock को केवल उस टीम के S3 प्रीफ़िक्स या KMS कुंजी तक पहुँच प्रदान करती है।

क्यों: कस्टम सेवा भूमिकाएँ संसाधन स्तर पर न्यूनतम विशेषाधिकार लागू करती हैं। Bedrock को व्यापक S3 पहुँच न दें और ऐप-परत फ़िल्टरिंग पर निर्भर न रहें।

Bedrock SSE-KMS के साथ एन्क्रिप्टेड S3 डेटा पढ़ने में विफल रहता है।

संबंधित CMK पर Bedrock सेवा भूमिका `kms:Decrypt` और बकेट/प्रीफ़िक्स पर `s3:GetObject` प्रदान करें।

क्यों: Bedrock डेटा पढ़ने के लिए अपनी सेवा भूमिका ग्रहण करता है; भूमिका को S3 और KMS दोनों अनुमतियों की आवश्यकता होती है।

संदर्भ

निगरानी, डीबगिंग, ऑडिट और अनुपालन के लिए Bedrock गतिविधि कैप्चर करें।

दो पूरक सेवाएँ। CloudTrail = प्रत्येक API कॉल के लिए कौन/कब/कहां से (पहचान, टाइमस्टैम्प, स्रोत IP)। Bedrock मॉडल इनवोकेशन लॉगिंग = वास्तविक प्रॉम्प्ट/प्रतिक्रिया पेलोड, CloudWatch लॉग या S3 पर लिखा गया। दोनों को सक्षम करें।

क्यों: CloudTrail केवल मेटाडेटा कैप्चर करता है; इनवोकेशन लॉगिंग सामग्री कैप्चर करती है। अनुपालन के लिए अक्सर दोनों की आवश्यकता होती है।

संदर्भ

ऑडिटर AI वर्कलोड के लिए AWS अनुपालन रिपोर्ट (SOC, ISO, PCI, HIPAA) का अनुरोध करता है।

AWS Artifact — ऑन-डिमांड AWS अनुपालन रिपोर्ट और समझौतों के लिए सेल्फ-सर्विस पोर्टल।

क्यों: AWS Audit Manager लगातार आपके उपयोग का ऑडिट करता है; AWS Artifact AWS के अपने प्रमाण प्रदान करता है।

संदर्भ

S3 (प्रशिक्षण कॉर्पस, मॉडल लॉग) में बैठे PII या अन्य संवेदनशील डेटा को खोजें और वर्गीकृत करें।

Amazon Macie — S3 के लिए ML-आधारित संवेदनशील-डेटा खोज।

क्यों: मैसी का उपयोग उस डेटा को खोजने के लिए करें जिसे मॉडल या उसके आउटपुट में समाप्त होने से पहले मास्किंग, विलोपन, या KMS एन्क्रिप्शन की आवश्यकता है।

संदर्भ

दुर्भावनापूर्ण उपयोगकर्ता इनपुट सिस्टम प्रॉम्प्ट को ओवरराइड करने, डेटा निकालने, या अनपेक्षित क्रियाओं को ट्रिगर करने का प्रयास करता है।

गहराई में रक्षा: सामग्री फ़िल्टरिंग के लिए Bedrock Guardrails, प्रॉम्प्ट टेम्प्लेट जो ओवरराइड पैटर्न का पता लगाते/अनदेखा करते हैं, इनपुट लंबाई सीमाएँ, आउटपुट सत्यापन, और एजेंटों के लिए न्यूनतम-विशेषाधिकार टूल अनुमतियाँ।

क्यों: कोई एक शमन पर्याप्त नहीं है; इनपुट फ़िल्टरिंग, आउटपुट फ़िल्टरिंग, और क्षमता सीमाओं को संयोजित करें।

एक कस्टम मॉडल को गोपनीय डेटा पर प्रशिक्षित किया गया था जो प्रतिक्रियाओं में लीक नहीं होना चाहिए।

मॉडल को हटाएँ, प्रशिक्षण सेट से गोपनीय रिकॉर्ड हटाएँ, और पुनः प्रशिक्षित करें। आउटपुट फ़िल्टरिंग पर्याप्त नहीं है।

क्यों: मॉडल भार में सन्निहित ज्ञान को इनफरेंस में मज़बूती से मास्क नहीं किया जा सकता है; केवल उस डेटा के बिना पुनः प्रशिक्षण ही इसे हटाता है।

निर्धारित करें कि AWS क्या सुरक्षित करता है और ग्राहक AI वर्कलोड के लिए क्या सुरक्षित करता है।

AWS साझा जिम्मेदारी मॉडल: AWS = क्लाउड की सुरक्षा (हार्डवेयर, हाइपरवाइजर, क्षेत्र)। ग्राहक = क्लाउड में सुरक्षा (डेटा, IAM, KMS कुंजी, नेटवर्क, ऐप कॉन्फ़िग)।

संदर्भ