मार्गदर्शिका

Google Cloud Professional Machine Learning Engineer

अंतिम समीक्षा: मई 2026

PMLE परीक्षा द्वारा परखे जाने वाले architectural patterns का स्कैन-योग्य संदर्भ। ऊपर से नीचे पढ़ें या किसी section पर जाएं।

ML समाधानों का आर्किटेक्टिंग

SQL में मजबूत कौशल वाली टीमों के लिए BigQuery में बड़े सारणीबद्ध डेटासेट पर वर्गीकरण, प्रतिगमन या अनुशंसा मॉडल बनाएं।

SQL सिंटैक्स के साथ BigQuery ML का उपयोग करें (उदाहरण के लिए, `CREATE MODEL ... OPTIONS(model_type='BOOSTED_TREE_CLASSIFIER')`)। `EXPLAIN_PREDICT` के साथ व्याख्या-क्षमता सक्षम करें।

क्यों: डेटा के संचलन से बचाता है और तीव्र विकास के लिए मौजूदा SQL कौशल का लाभ उठाता है। डेटा शासन को BigQuery के भीतर रखता है और एकीकृत व्याख्या-क्षमता प्रदान करता है।

संदर्भ

न्यूनतम ML विशेषज्ञता के साथ फ़ॉर्म या इनवॉइस जैसे असंरचित दस्तावेज़ों से संरचित डेटा (उदाहरण के लिए, नाम, दिनांक, कोड) निकालें।

पूर्व-प्रशिक्षित या कस्टम प्रोसेसर के साथ Document AI का उपयोग करें। विशेष लेआउट के लिए लेबल किए गए नमूना दस्तावेज़ों के साथ एक कस्टम प्रोसेसर को प्रशिक्षित करें।

क्यों: दस्तावेज़ पार्सिंग के लिए एक विशेष, प्रबंधित सेवा जो स्क्रैच से कस्टम OCR और पार्सिंग लॉजिक बनाने से बेहतर प्रदर्शन करती है।

संदर्भ

कस्टम मॉडल को प्रशिक्षित किए बिना भावना, संस्थाओं या विषयों के लिए ऑडियो या टेक्स्ट जैसे असंरचित डेटा का विश्लेषण करें।

पूर्व-प्रशिक्षित API को श्रृंखला में जोड़ें। उदाहरण: प्रतिलेखन के लिए Speech-to-Text API, उसके बाद इकाई और भावना विश्लेषण के लिए Natural Language API।

क्यों: सामान्य उपयोग के मामलों के लिए सबसे तेज़ समय-से-बाजार। डेटा लेबलिंग या मॉडल प्रशिक्षण की आवश्यकता के बिना Google-प्रशिक्षित मॉडल का लाभ उठाता है।

लेबल किए गए डेटा के साथ लेकिन सीमित ML कोडिंग विशेषज्ञता के साथ एक उच्च-गुणवत्ता वाला कस्टम इमेज, वीडियो या सारणीबद्ध मॉडल बनाएं।

Vertex AI AutoML (उदाहरण के लिए, AutoML Vision Object Detection) का उपयोग करें। लेबल किया गया डेटा प्रदान करें और सेवा को आर्किटेक्चर खोज और प्रशिक्षण को संभालने दें।

क्यों: उपयोग में आसानी के साथ कस्टम मॉडल की ज़रूरतों को संतुलित करता है। कस्टम कार्यों (उदाहरण के लिए, विशिष्ट उत्पादों की पहचान करना) के लिए सामान्य पूर्व-प्रशिक्षित API से बेहतर प्रदर्शन करता है।

संदर्भ

एक संवादी AI या ज्ञान सहायक बनाएं जो एक बड़े, मालिकाना दस्तावेज़ संग्रह के आधार पर प्रश्नों का उत्तर देता है।

एक Retrieval-Augmented Generation (RAG) पैटर्न लागू करें। प्रासंगिक दस्तावेज़ चंक्स खोजने के लिए Vertex AI Vector Search का उपयोग करें और उन्हें ग्राउंडेड प्रतिक्रिया जनरेशन के लिए Gemini मॉडल को संदर्भ के रूप में पास करें।

क्यों: LLM प्रतिक्रियाओं को तथ्यात्मक डेटा में आधारित करता है, मतिभ्रम को कम करता है और उद्धरण प्रदान करता है। ज्ञान के लिए फ़ाइन-ट्यूनिंग की तुलना में अधिक स्केलेबल और अप-टू-डेट।

न्यूनतम कोड के साथ एक एंटरप्राइज़-ग्रेड चैटबॉट या सर्च इंजन बनाएं, जो Cloud Storage या BigQuery जैसे आंतरिक डेटा स्रोतों से जुड़ा हो।

Vertex AI Agent Builder का उपयोग करें। अपने ज्ञान आधार से डेटा स्टोर कनेक्टर कॉन्फ़िगर करें और वास्तविक समय डेटा लुकअप के लिए टूल (फ़ंक्शन कॉलिंग) का उपयोग करें।

क्यों: एक लो-कोड समाधान जो तीव्र परिनियोजन के लिए RAG पाइपलाइन निर्माण को स्वचालित करता है, जिसमें दस्तावेज़ पार्सिंग, चंकिंग, एम्बेडिंग और रिट्रीवल शामिल है।

उप-सेकंड विलंबता के साथ विनिर्माण कैमरों से उच्च-मात्रा वाले वीडियो स्ट्रीम पर वास्तविक समय में दोष का पता लगाएं।

Vertex AI Edge Manager का उपयोग करके अनुकूलित मॉडल को एज डिवाइस पर तैनात करें। स्थानीय रूप से अनुमान लगाएं और केवल दोष मेटाडेटा को निगरानी के लिए क्लाउड पर भेजें।

क्यों: उच्च बैंडविड्थ और कम विलंबता आवश्यकताओं को पूरा करता है जो केवल क्लाउड दृष्टिकोण के साथ अव्यावहारिक या लागत-निषेधात्मक हैं।

डेटा/मॉडल का सहयोग और प्रबंधन

बैच प्रशिक्षण और वास्तविक समय परोसने के बीच संगति सुनिश्चित करने के लिए ML सुविधाओं का प्रबंधन करें, जिससे प्रशिक्षण-परिवेषण पूर्वाग्रह को रोका जा सके।

Vertex AI Feature Store का उपयोग करें। विभिन्न सिंक शेड्यूल (बैच, स्ट्रीमिंग) के साथ फीचर समूह परिभाषित करें। पॉइंट-इन-टाइम सही प्रशिक्षण डेटा के लिए टाइम-ट्रैवल क्वेरी का उपयोग करें।

क्यों: एक केंद्रीकृत फीचर रिपॉजिटरी प्रदान करता है, सुसंगत फीचर परिभाषाएं सुनिश्चित करता है, और प्रशिक्षण डेटा के लिए पॉइंट-इन-टाइम शुद्धता को हल करता है।

संदर्भ

वर्जनिंग, अनुमोदन वर्कफ़्लो और ऑडिट करने योग्य परिनियोजन इतिहास के साथ मॉडल शासन लागू करें।

मॉडल को संस्करणित और संग्रहीत करने के लिए Vertex AI Model Registry का उपयोग करें। प्रयोगों और डेटासेट से लिंक करें। परिनियोजन अनुमोदनों को प्रबंधित करने के लिए IAM और संस्करण उपनामों (उदाहरण के लिए, "production") का उपयोग करें।

क्यों: मॉडल प्रबंधन को केंद्रीकृत करता है, शासन, प्रतिलिपि प्रस्तुत करने योग्यता और सुरक्षित रोलबैक क्षमताओं को सक्षम बनाता है। CI/CD पाइपलाइन के साथ एकीकृत होता है।

पुनरुत्पादन योग्यता सुनिश्चित करने के लिए ML प्रयोगों को व्यवस्थित रूप से ट्रैक और तुलना करें, जिसमें हाइपरपैरामीटर, मेट्रिक्स और कलाकृतियाँ शामिल हैं।

Vertex AI Experiments का उपयोग करें। प्रशिक्षण कार्यों से स्वचालित रूप से पैरामीटर और मेट्रिक्स लॉग करें। पूर्ण वंशावली ट्रैकिंग के लिए कलाकृतियों और डेटासेट को लिंक करें।

क्यों: बेहतर सहयोग के लिए स्प्रेडशीट या मैन्युअल लॉग से परे, प्रयोग प्रबंधन के लिए एक संरचित, क्वेरी करने योग्य प्रणाली प्रदान करता है।

सख्त डेटा निवास और सुरक्षा आवश्यकताओं को पूरा करते हुए संवेदनशील डेटा (उदाहरण के लिए, PHI, PII) पर मॉडल को प्रशिक्षित और परोसें।

VPC Service Controls परिधि के भीतर Vertex AI कॉन्फ़िगर करें। नेटवर्क अलगाव के लिए Private Endpoints और स्थिर डेटा के लिए Customer-Managed Encryption Keys (CMEK) का उपयोग करें।

क्यों: एक सुरक्षित नेटवर्क परिधि बनाता है जो डेटा के बहिर्गमन को रोकता है और सुनिश्चित करता है कि सभी प्रोसेसिंग और डेटा ट्रांज़िट नियंत्रित सीमाओं के भीतर हों।

यह सुनिश्चित करने के लिए कि प्रयोग प्रतिलिपि प्रस्तुत करने योग्य हों और मॉडल को प्रशिक्षण के लिए उपयोग किए गए सटीक डेटा स्नैपशॉट तक ट्रैक किया जा सके, प्रशिक्षण डेटा को संस्करण नियंत्रित करें।

वर्जनिंग के साथ Vertex AI Managed Datasets का उपयोग करें। महत्वपूर्ण डेटा परिवर्तनों के लिए नए डेटासेट संस्करण बनाएं और विशिष्ट संस्करणों को प्रशिक्षण रन से लिंक करें।

क्यों: ML मेटाडेटा में स्वचालित वंशावली ट्रैकिंग के साथ अपरिवर्तनीय, संस्करणित डेटा स्नैपशॉट प्रदान करता है, जो अनुपालन और डीबगिंग के लिए महत्वपूर्ण है।

मानव एनोटेशन के लिए सीमित बजट के साथ मॉडल प्रशिक्षण के लिए एक बड़े, अल-लेबल डेटासेट को लेबल करें।

एक सक्रिय लर्निंग लूप लागू करें। एक छोटे लेबल किए गए सबसेट पर एक प्रारंभिक मॉडल को प्रशिक्षित करें, फिर मानव लेबलिंग के लिए सबसे जानकारीपूर्ण नमूनों को प्राथमिकता देने के लिए इसके अनिश्चितता स्कोर का उपयोग करें।

क्यों: प्रत्येक मानव-लेबल नमूने के मूल्य को अधिकतम करता है, यादृच्छिक नमूनाकरण या व्यापक लेबलिंग की तुलना में लेबलिंग लागत और समय को कम करता है।

प्रोटोटाइप को ML मॉडल में स्केलिंग

कई GPU या नोड्स में स्केलिंग करके एक विशाल डेटासेट पर एक बड़े मॉडल के लिए प्रशिक्षण समय कम करें।

एक समकालिक डेटा पैरेललिज्म रणनीति का उपयोग करें, जैसे TensorFlow का `MultiWorkerMirroredStrategy`। प्रशिक्षण कोड को पैकेज करें और मल्टी-वर्कर कॉन्फ़िगरेशन के साथ Vertex AI Training में सबमिट करें।

क्यों: अधिकांश प्रशिक्षण कार्यों को स्केलिंग के लिए मानक, प्रभावी तरीका। Vertex AI क्लस्टर सेटअप और सिंक्रनाइज़ेशन का प्रबंधन करता है, जिसमें न्यूनतम कोड परिवर्तन की आवश्यकता होती है।

एक फाउंडेशन मॉडल (LLM) को प्रशिक्षित करें जो एक एकल एक्सीलेटर की मेमोरी में फिट होने के लिए बहुत बड़ा है (उदाहरण के लिए, >50B पैरामीटर)।

3D पैरेललिज्म का उपयोग करें: Tensor Parallelism (नोड्स के भीतर स्तरों को विभाजित करता है), Pipeline Parallelism (नोड्स में स्तरों को स्टेज करता है), और Data Parallelism (पॉड में प्रतिकृतियां)। TPU पॉड्स पर प्रशिक्षित करें।

क्यों: एकल-डिवाइस मेमोरी से अधिक मॉडल को प्रशिक्षित करने का एकमात्र व्यवहार्य तरीका। प्रत्येक पैरेललिज्म आयाम एक अलग स्केलिंग बॉटलनेक (मेमोरी, कंप्यूट, नेटवर्क) को संबोधित करता है।

लंबे समय तक चलने वाले, दोष-सहिष्णु प्रशिक्षण कार्यों (उदाहरण के लिए, >12 घंटे) के लिए लागत कम करें।

प्रशिक्षण के लिए Spot VM (प्रीएम्पटिबल) का उपयोग करें, जो 80% तक लागत बचत प्रदान करते हैं। Cloud Storage पर लगातार चेकपॉइंटिंग लागू करें और स्वचालित पुनरारंभ के लिए कार्य को कॉन्फ़िगर करें।

क्यों: प्रशिक्षण लागतों को नाटकीय रूप से कम करता है। चेकपॉइंटिंग सुनिश्चित करता है कि प्रीएम्प्शन पर न्यूनतम प्रगति खो जाए, जिससे यह गैर-आवश्यक कार्यों के लिए एक विश्वसनीय रणनीति बन जाती है।

एक बड़े और जटिल खोज स्थान वाले मॉडल के लिए इष्टतम हाइपरपैरामीटर को कुशलता से खोजें।

बेयसियन ऑप्टिमाइज़ेशन के साथ Vertex AI Hyperparameter Tuning (Vizier) का उपयोग करें। खोज स्थान और उद्देश्य मीट्रिक परिभाषित करें। अनुपयोगी परीक्षणों को छांटने के लिए प्रारंभिक स्टॉपिंग सक्षम करें।

क्यों: बेयसियन ऑप्टिमाइज़ेशन ग्रिड या यादृच्छिक खोज की तुलना में अधिक नमूना-कुशल है, कम परीक्षणों के साथ बेहतर कॉन्फ़िगरेशन ढूंढता है, जिससे समय और धन की बचत होती है।

एक प्रशिक्षण कार्य के लिए विशिष्ट लाइब्रेरी संस्करण, कस्टम CUDA कर्नेल, या निजी पैकेज की आवश्यकता होती है जो पूर्व-निर्मित कंटेनरों में उपलब्ध नहीं हैं।

सभी निर्भरताओं के साथ एक कस्टम Docker कंटेनर बनाएं। कंटेनर को Artifact Registry पर पुश करें और इसे Vertex AI Training कार्य में संदर्भित करें।

क्यों: निष्पादन वातावरण पर पूर्ण नियंत्रण प्रदान करता है, पुनरुत्पादन योग्यता सुनिश्चित करता है और जटिल निर्भरताओं को संभालता है जो पूर्व-निर्मित कंटेनर नहीं कर सकते।

इसे Cloud Storage में निर्यात करने में देरी या लागत के बिना एक बहुत बड़े BigQuery डेटासेट पर एक मॉडल को प्रशिक्षित करें।

प्रशिक्षण कंटेनर से सीधे BigQuery Storage Read API का उपयोग करें। यह TensorFlow या PyTorch डेटा लोडर्स में डेटा की उच्च-थ्रूपुट, समानांतर स्ट्रीमिंग को सक्षम बनाता है।

क्यों: प्रशिक्षण के लिए बड़े BQ डेटासेट को पढ़ने का सबसे तेज़ और सबसे कुशल तरीका। मध्यवर्ती संग्रहण और I/O बॉटलनेक से बचाता है।

संदर्भ

मॉडल परोसना और स्केलिंग करना

कम विलंबता बनाए रखते हुए और लागत को अनुकूलित करते हुए उच्च या परिवर्तनीय ट्रैफ़िक (उदाहरण के लिए, 10,000 RPS शिखर) वाले मॉडल को परोसें।

GPU मशीन प्रकार के साथ मॉडल को Vertex AI Endpoint पर तैनात करें। ट्रैफ़िक या उपयोग के आधार पर न्यूनतम और अधिकतम प्रतिकृति गणना के साथ ऑटोस्केलिंग कॉन्फ़िगर करें।

क्यों: मांग के अनुरूप संसाधनों को स्वचालित रूप से स्केल करता है, शिखर के दौरान प्रदर्शन और मंदी के दौरान लागत बचत सुनिश्चित करता है। GPU जटिल मॉडल के लिए कम विलंबता प्रदान करते हैं।

प्रत्येक क्षेत्र में न्यूनतम विलंबता के साथ वैश्विक उपयोगकर्ता आधार को मॉडल भविष्यवाणियाँ परोसें।

मॉडल को प्रत्येक लक्ष्य भूगोल (उदाहरण के लिए, US, EU, APAC) में क्षेत्रीय Vertex AI Endpoints पर तैनात करें। उपयोगकर्ताओं को निकटतम एंडपॉइंट पर रूट करने के लिए एक वैश्विक लोड बैलेंसर का उपयोग करें।

क्यों: उपयोगकर्ता के करीब के बुनियादी ढांचे से अनुरोधों को परोसकर नेटवर्क विलंबता को कम करता है। विलंबता-संवेदनशील वैश्विक अनुप्रयोगों के लिए आवश्यक है।

प्रदर्शन की निगरानी करते हुए धीरे-धीरे ट्रैफ़िक को स्थानांतरित करके एक नए मॉडल संस्करण को सुरक्षित रूप से तैनात करें।

नए संस्करण को वर्तमान मॉडल के समान Vertex AI Endpoint पर तैनात करें। ट्रैफ़िक स्प्लिटिंग का उपयोग करके ट्रैफ़िक का एक छोटा प्रतिशत (उदाहरण के लिए, 5%) नए संस्करण पर भेजें, इसे धीरे-धीरे बढ़ाएं।

क्यों: कैनरी परिनियोजन और A/B परीक्षण को सक्षम बनाता है। तत्काल रोलबैक क्षमता के साथ वास्तविक उत्पादन ट्रैफ़िक के तहत नए मॉडल के सुरक्षित सत्यापन की अनुमति देता है।

लाखों आइटम के कैटलॉग से 50ms से कम विलंबता के साथ वास्तविक समय की सिफारिशें परोसें।

दो-चरण वास्तुकला लागू करें: 1) शीर्ष-K उम्मीदवारों को खोजने के लिए Vertex AI Vector Search (ANN) का उपयोग करके एक तेज़ पुनर्प्राप्ति चरण। 2) एक सटीक रैंकिंग चरण जो छोटे उम्मीदवार सेट पर अधिक जटिल मॉडल लागू करता है।

क्यों: सटीकता और विलंबता को संतुलित करता है। तेज़ ANN पुनर्प्राप्ति विशाल आइटम स्थान को छांटता है, जिससे कम्प्यूटेशनल रूप से महंगा रैंकर एक प्रबंधनीय सबसेट पर काम कर पाता है।

सख्त वास्तविक समय आवश्यकताओं (<20ms) को पूरा करने के लिए मॉडल अनुमान विलंबता कम करें।

मॉडल ऑप्टिमाइज़ेशन तकनीकों को लागू करें। GPU के लिए TensorRT या CPU के लिए OpenVINO के साथ मॉडल को संकलित करें। सटीकता कम करने और थ्रूपुट बढ़ाने के लिए क्वांटिज़ेशन (उदाहरण के लिए, INT8) का उपयोग करें।

क्यों: ये तकनीकें मॉडल ग्राफ़ को अनुकूलित करती हैं और हार्डवेयर-विशिष्ट त्वरण का लाभ उठाती हैं, अक्सर महत्वपूर्ण सटीकता हानि के बिना 2-5 गुना विलंबता में कमी प्रदान करती हैं।

प्रत्येक के लिए समर्पित संसाधनों का प्रावधान किए बिना दर्जनों कम-ट्रैफ़िक मॉडल को लागत प्रभावी ढंग से परोसें।

साझा परोसने वाले संसाधनों के सेट पर कई मॉडल को सह-होस्ट करने के लिए एक मल्टी-मॉडल एंडपॉइंट का उपयोग करें। Vertex AI आने वाले अनुरोधों के आधार पर मॉडल को गतिशील रूप से लोड करता है।

क्यों: समर्पित एकल-मॉडल एंडपॉइंट्स की तुलना में संसाधन उपयोग में सुधार करके, बार-बार ट्रैफ़िक वाले कई मॉडल को परोसने की लागत को नाटकीय रूप से कम करता है।

इंटरैक्टिव अनुप्रयोगों के लिए बड़े भाषा मॉडल (LLM) जनरेशन की विलंबता कम करें।

सट्टा डिकोडिंग लागू करें। उम्मीदवार टोकन उत्पन्न करने के लिए एक छोटे, तेज़ "ड्राफ्ट" मॉडल का उपयोग करें, जिन्हें बाद में बड़े, अधिक सटीक मॉडल द्वारा एक ही पास में सत्यापित किया जाता है।

क्यों: अनुक्रमिक डिकोडिंग को समानांतर सत्यापन से बदलकर टोकन जनरेशन को महत्वपूर्ण रूप से गति देता है, जिससे एक प्रमुख LLM सर्विंग बॉटलनेक कम हो जाता है।

ML पाइपलाइन को स्वचालित और व्यवस्थित करना

डेटा सत्यापन, प्रीप्रोसेसिंग, प्रशिक्षण, मूल्यांकन और सशर्त परिनियोजन सहित एक बहु-चरणीय ML वर्कफ़्लो को स्वचालित करें।

Kubeflow Pipelines (KFP) SDK के साथ Vertex AI Pipelines का उपयोग करके वर्कफ़्लो को DAG के रूप में परिभाषित करें। प्रत्येक चरण के लिए पूर्व-निर्मित या कस्टम घटकों का उपयोग करें।

क्यों: ML के लिए एक प्रबंधित, सर्वरलेस ऑर्केस्ट्रेशन सेवा प्रदान करता है जिसमें अंतर्निहित कलाकृति ट्रैकिंग, वंशावली, कैशिंग और सशर्त निष्पादन शामिल है।

संदर्भ

खराब डेटा को प्रशिक्षण पाइपलाइन में प्रवेश करने और मॉडल की गुणवत्ता में गिरावट का कारण बनने से रोकें।

पाइपलाइन में शुरुआती चरण में एक TensorFlow Data Validation (TFDV) घटक जोड़ें। आने वाले डेटा के आंकड़ों की आधारभूत स्कीमा से तुलना करें और यदि बहाव या विसंगतियाँ पाई जाती हैं तो पाइपलाइन को रोक दें।

क्यों: एक स्वचालित गुणवत्ता गेट के रूप में कार्य करता है, डेटा समस्याओं को सक्रिय रूप से पकड़ता है इससे पहले कि वे कंप्यूट संसाधनों को बर्बाद करें और एक दोषपूर्ण मॉडल में परिणत हों।

नया डेटा आने पर या मॉडल बहाव का पता चलने पर स्वचालित रूप से मॉडल रिट्रेनिंग ट्रिगर करें।

एक इवेंट-संचालित वास्तुकला का उपयोग करें। एक Pub/Sub संदेश (उदाहरण के लिए, Cloud Storage अपडेट या बहाव अलर्ट से) एक Cloud Function या Eventarc ट्रिगर को ट्रिगर करता है जो एक Vertex AI Pipeline रन शुरू करता है।

क्यों: एक प्रतिक्रियाशील, कुशल प्रणाली बनाता है जो केवल आवश्यक होने पर मॉडल को पुन: प्रशिक्षित करता है, जिससे अनावश्यक निर्धारित रन के बिना मॉडल की ताजगी सुनिश्चित होती है।

मॉडल को उत्पादन में तभी स्वचालित रूप से बढ़ावा दें जब नया मॉडल प्रमुख व्यावसायिक मेट्रिक्स पर वर्तमान उत्पादन मॉडल से बेहतर प्रदर्शन करता हो।

एक Vertex AI Pipeline में, एक मूल्यांकन घटक जोड़ें जो नए मॉडल की उत्पादन आधारभूत से तुलना करता है। परिनियोजन घटक को तभी निष्पादित करने के लिए एक `dsl.Condition` का उपयोग करें जब नया मॉडल प्रदर्शन सीमा को पूरा करता है या उससे अधिक होता है।

क्यों: MLOps पाइपलाइन में अंतिम गुणवत्ता गेट को स्वचालित करता है, प्रदर्शन प्रतिगमन को रोकता है और सुनिश्चित करता है कि केवल बेहतर मॉडल ही तैनात किए जाएं।

कई ML पाइपलाइन और टीमों में सामान्य कार्यों (उदाहरण के लिए, फीचर इंजीनियरिंग, मूल्यांकन) को मानकीकृत करें।

साझा लॉजिक को संस्करणित, कंटेनरीकृत कस्टम घटकों में पैकेज करें। उन्हें Artifact Registry में संग्रहीत करें और उन्हें परियोजनाओं में साझा करें।

क्यों: कोड के पुन: उपयोग को बढ़ावा देता है, संगति सुनिश्चित करता है और रखरखाव को सरल बनाता है। टीमें विश्वसनीय, मानकीकृत घटकों की एक लाइब्रेरी से जटिल पाइपलाइन बना सकती हैं।

बार-बार चलने के दौरान अनावश्यक गणना से बचकर पाइपलाइन विकास को गति दें और लागत कम करें।

Vertex AI Pipelines में निष्पादन कैशिंग सक्षम करें। यदि इसके इनपुट और कार्यान्वयन में कोई परिवर्तन नहीं हुआ है तो सेवा स्वचालित रूप से एक घटक के आउटपुट का पुन: उपयोग करेगी।

क्यों: आपको एक पाइपलाइन को फिर से चलाने और केवल उन घटकों को निष्पादित करने की अनुमति देकर पुनरावृत्ति विकास को नाटकीय रूप से गति देता है जिन्हें आपने बदला है।

ML पाइपलाइन कोड में परिवर्तनों का स्वचालित रूप से परीक्षण और परिनियोजन करने के लिए एक CI/CD वर्कफ़्लो लागू करें।

Git रिपॉजिटरी पुश द्वारा ट्रिगर किए गए Cloud Build का उपयोग करें। निर्माण प्रक्रिया घटक इकाई परीक्षण चलाती है, पाइपलाइन को संकलित करती है, और इसे एक स्टेजिंग या उत्पादन वातावरण में तैनात करती है।

क्यों: MLOps पर सॉफ्टवेयर इंजीनियरिंग सर्वोत्तम प्रथाओं को लागू करता है, जिससे उत्पादन ML सिस्टम में तीव्र, विश्वसनीय और स्वचालित अपडेट सक्षम होते हैं।

ML समाधानों की निगरानी और रखरखाव

यह पता लगाएं कि आने वाले डेटा या अनुमानित परिणामों में बदलाव के कारण उत्पादन मॉडल का प्रदर्शन कब गिर रहा है।

Vertex AI Model Monitoring कॉन्फ़िगर करें। प्रशिक्षण-सेवारत पूर्वाग्रह (प्रशिक्षण से इनपुट वितरण परिवर्तन) और भविष्यवाणी बहाव (समय के साथ आउटपुट वितरण परिवर्तन) का पता लगाने के लिए एक कार्य स्थापित करें।

क्यों: मॉडल गिरावट के लिए एक स्वचालित प्रारंभिक चेतावनी प्रणाली प्रदान करता है, व्यापार मेट्रिक्स के महत्वपूर्ण रूप से प्रभावित होने से पहले सक्रिय रिट्रेनिंग या हस्तक्षेप को सक्षम बनाता है।

संदर्भ

मॉडल का प्रदर्शन गिर रहा है, लेकिन इनपुट फीचर वितरण स्थिर प्रतीत होते हैं (कोई डेटा बहाव नहीं पाया गया)।

विलंबित ग्राउंड ट्रुथ लेबल के विरुद्ध भविष्यवाणी परिणामों की निगरानी लागू करें। सटीकता या अन्य मूल्यांकन मेट्रिक्स में गिरावट अवधारणा बहाव को इंगित करती है, जहां सुविधाओं और लक्ष्य के बीच संबंध बदल गया है।

क्यों: फीचर बहाव निगरानी अकेले पर्याप्त नहीं है। अवधारणा बहाव के लिए अंतर्निहित पैटर्न में परिवर्तनों का पता लगाने के लिए वास्तविक के विरुद्ध मॉडल भविष्यवाणियों का मूल्यांकन करना आवश्यक है।

नियामक अनुपालन को पूरा करने या हितधारक विश्वास के लिए व्यक्तिगत मॉडल भविष्यवाणियों के लिए स्पष्टीकरण प्रदान करें।

तैनात एंडपॉइंट पर Vertex AI Explainable AI सक्षम करें। प्रत्येक भविष्यवाणी के लिए फीचर एट्रिब्यूशन प्राप्त करने के लिए Sampled Shapley या Integrated Gradients जैसे तरीकों का उपयोग करें।

क्यों: स्थानीय, प्रति-भविष्यवाणी स्पष्टीकरण प्रदान करता है जो यह पहचानता है कि किन सुविधाओं ने निर्णय में योगदान दिया, जो "ब्लैक-बॉक्स" मॉडल के ऑडिटिंग और डीबगिंग के लिए आवश्यक है।

यह सुनिश्चित करें कि एक मॉडल विभिन्न उपयोगकर्ता खंडों (उदाहरण के लिए, जनसांख्यिकी) में समान रूप से प्रदर्शन करता है और छिपे हुए पूर्वाग्रहों का पता लगाएं।

संवेदनशील गुणों द्वारा परिभाषित डेटा के स्लाइस पर प्रदर्शन मेट्रिक्स (उदाहरण के लिए, सटीकता, त्रुटि दर) की गणना और ट्रैक करने के लिए मॉडल निगरानी कॉन्फ़िगर करें।

क्यों: कुल मेट्रिक्स अल्पसंख्यक उपसमूहों के लिए खराब प्रदर्शन को छिपा सकते हैं। निष्पक्षता के मुद्दों की पहचान और उन्हें कम करने के लिए स्लाइस्ड विश्लेषण महत्वपूर्ण है।

एक मॉडल को उन इनपुट पर अविश्वसनीय, अति-आत्मविश्वासी भविष्यवाणियां करने से रोकें जो उसके प्रशिक्षण डेटा से मौलिक रूप से भिन्न हैं।

मुख्य मॉडल के साथ एक आउट-ऑफ-डिस्ट्रीब्यूशन (OOD) डिटेक्शन मॉडल (उदाहरण के लिए, एक ऑटोएन्कोडर) लागू करें। उच्च पुनर्निर्माण त्रुटि एक इनपुट को OOD के रूप में ध्वजांकित करती है, जिससे फ़ॉलबैक लॉजिक ट्रिगर होता है।

क्यों: डोमेन शिफ्ट के खिलाफ एक सुरक्षा तंत्र प्रदान करता है, यह पहचान कर मॉडल की मजबूती में सुधार करता है कि मॉडल कब अपनी विशेषज्ञता के क्षेत्र से बाहर काम कर रहा है।

एक मॉडल के इच्छित उपयोग, सीमाओं, प्रशिक्षण डेटा और निष्पक्षता मूल्यांकन को तकनीकी और गैर-तकनीकी हितधारकों दोनों के लिए दस्तावेज़ित करें।

Google के फ्रेमवर्क का उपयोग करके एक Model Card बनाएं। मॉडल विवरण, इच्छित उपयोग, नैतिक विचार, मात्रात्मक विश्लेषण (स्लाइस्ड मेट्रिक्स सहित) और सीमाओं पर अनुभाग शामिल करें।

क्यों: जिम्मेदार AI प्रलेखन के लिए एक मानक जो किसी संगठन में पारदर्शिता, जवाबदेही और उचित मॉडल उपयोग को बढ़ावा देता है।

अनुपालन और डीबगिंग के लिए सभी भविष्यवाणी अनुरोधों और प्रतिक्रियाओं का एक खोजने योग्य, ऑडिट करने योग्य लॉग बनाए रखें।

Vertex AI Endpoint पर एक्सेस लॉगिंग सक्षम करें। संरचित, दीर्घकालिक भंडारण और विश्लेषण के लिए BigQuery में लॉग निर्यात करने के लिए कॉन्फ़िगर करें।

क्यों: BigQuery ऑडिट ट्रेल्स बनाने, भविष्यवाणी प्रवृत्तियों का विश्लेषण करने और भविष्यवाणी को ग्राउंड ट्रुथ डेटा के साथ जोड़ने के लिए एक स्केलेबल और क्वेरी करने योग्य प्लेटफॉर्म प्रदान करता है।

मार्गदर्शिका

Google Cloud Professional Machine Learning Engineer

अंतिम समीक्षा: मई 2026

ML समाधानों का आर्किटेक्टिंग

संदर्भ

डेटा/मॉडल का सहयोग और प्रबंधन

संदर्भ

प्रोटोटाइप को ML मॉडल में स्केलिंग

संदर्भ

मॉडल परोसना और स्केलिंग करना

इंटरैक्टिव अनुप्रयोगों के लिए बड़े भाषा मॉडल (LLM) जनरेशन की विलंबता कम करें।

ML पाइपलाइन को स्वचालित और व्यवस्थित करना

संदर्भ

ML समाधानों की निगरानी और रखरखाव

संदर्भ