NVIDIA-Certified Professional: Generative AI LLMs
255 अभ्यास प्रश्न
अंतिम समीक्षा: April 2026
आपकी अध्ययन यात्रा के लिए व्यक्तिगत नोट्स और संसाधन लिंक
सर्टिफिकेशन द्वारा फ़िल्टर करें
NVIDIA-Certified Professional: Generative AI LLMs (NCP-GENL) एक पेशेवर-स्तर का प्रमाण-पत्र है जो NVIDIA त्वरित बुनियादी ढांचे पर बड़े भाषा मॉडल को बड़े पैमाने पर अनुकूलित करने, फाइन-ट्यून करने, तैनात करने और संचालित करने की क्षमता को मान्य करता है। यह ML इंजीनियरों, LLM/इनफेरेंस इंजीनियरों और MLOps चिकित्सकों को लक्षित करता है जो पूर्ण जीवनचक्र के मालिक हैं: quantization और TensorRT-LLM संकलन, मल्टी-GPU समानांतरता, NeMo के साथ LoRA/QLoRA/RLHF फाइन-ट्यूनिंग, NIM और Triton के माध्यम से H100/Blackwell पर डिप्लॉयमेंट, साथ ही मूल्यांकन, ऑब्ज़र्वेबिलिटी और सुरक्षा। Certiverse के माध्यम से ऑनलाइन दिया जाने वाला, यह परीक्षा परिदृश्य-उन्मुख है और इसमें कोर्सवर्क के बजाय व्यावहारिक उत्पादन अनुभव की आवश्यकता होती है। लगभग 70% पास बार (700/1000), $200 शुल्क और दो साल की वैधता के साथ, यह गहराई और परिचालन कठोरता दोनों में NCA-GENL सहयोगी स्तर से स्पष्ट रूप से ऊपर है।
17% के साथ सबसे भारी डोमेन। इसमें पोस्ट-ट्रेनिंग quantization (INT8, FP8, INT4/AWQ, GPTQ) बनाम quantization-aware ट्रेनिंग, KV-cache ऑप्टिमाइजेशन, वेट प्रूनिंग और डिस्टिलेशन, और इन-फ्लाइट (निरंतर) बैचिंग के साथ TensorRT-LLM इंजन निर्माण शामिल है। विलंबता, थ्रूपुट, मेमोरी फ़ुटप्रिंट और सटीकता में कमी के बीच संतुलन पर प्रश्न, और Hopper/Blackwell पर FP8 कब INT8 से बेहतर प्रदर्शन करता है, इसकी अपेक्षा करें।
14% भारित। इसमें tensor/pipeline/sequence parallelism, मल्टी-GPU और मल्टी-नोड शार्डिंग, NVLink/NVSwitch और InfiniBand टोपोलॉजी जागरूकता, CUDA Graphs, मिक्स्ड प्रेसिजन, और Nsight और DCGM के साथ GPU उपयोगिता प्रोफाइलिंग का परीक्षण किया जाता है। प्रश्न इस बात की पड़ताल करते हैं कि सिंगल-GPU मेमोरी से अधिक वाले मॉडल को कैसे स्केल करें और कम्युनिकेशन-बाउंड बनाम कंप्यूट-बाउंड बॉटलनेक का निदान कैसे करें।
13% भारित। यह बुनियादी बातों से परे उत्पादन प्रॉम्प्टिंग में जाता है: फ्यू-शॉट और चेन-ऑफ-थॉट डिज़ाइन, संरचित/JSON-बाध्य आउटपुट, सिस्टम-प्रॉम्प्ट वर्जनिंग, रिट्रीवल-ऑगमेंटेड प्रॉम्प्टिंग, और प्रॉम्प्ट-इंजैक्शन जागरूकता। उत्तर की गुणवत्ता को बनाए रखते हुए टोकन लागत और विलंबता को कम करने पर, और स्कीमा-बाध्य आउटपुट के लिए गाइडेड डिकोडिंग पर परिदृश्यों की अपेक्षा करें।
13% भारित। इसमें पूर्ण फाइन-ट्यूनिंग बनाम पैरामीटर-कुशल तरीके (LoRA, QLoRA, P-tuning, एडाप्टर), SFT डेटा क्यूरेशन, RLHF/DPO अलाइनमेंट, NeMo और NeMo Customizer वर्कफ्लो, और कैटास्ट्रॉफिक-फॉरगेटिंग मिटिगेशन शामिल हैं। प्रश्न परीक्षण करते हैं कि LoRA कब पर्याप्त है, इनफेरेंस के लिए एडाप्टर को कैसे मर्ज करें, और किसी लक्ष्य कार्य के लिए रैंक, लर्निंग रेट और डेटासेट का आकार कैसे निर्धारित करें।
9% भारित। इसमें प्रीट्रेनिंग/फाइन-ट्यूनिंग कॉर्पस क्यूरेशन, डी-डुप्लीकेशन, गुणवत्ता फ़िल्टरिंग, टोकनाइजेशन और शब्दावली विकल्प, NeMo के लिए डेटासेट फ़ॉर्मेटिंग, PII स्क्रबिंग और मूल्यांकन सेट के खिलाफ डीकंटामिनेशन पर ध्यान केंद्रित किया गया है। रिप्रोड्यूसिबल, नियंत्रित डेटा पाइपलाइन बनाने और डाउनस्ट्रीम मॉडल व्यवहार पर डेटा गुणवत्ता के प्रभाव पर प्रश्नों की अपेक्षा करें।
9% भारित। इसमें NVIDIA NIM माइक्रोसेवाओं, Triton Inference Server बैकएंड, TensorRT-LLM रनटाइम कॉन्फ़िगरेशन, ऑटोस्केलिंग, मल्टी-मॉडल और कंकरेंट सर्विंग, और OpenAI-संगत एंडपॉइंट के साथ सर्विंग शामिल है। NIM बनाम एक कस्टम Triton एन्सेम्बल चुनने, डायनेमिक बैचिंग कॉन्फ़िगर करने और परिवर्तनीय लोड के तहत विलंबता SLOs को पूरा करने पर परिदृश्य प्रश्नों की अपेक्षा करें।
7% भारित। इसमें ऑफ़लाइन और ऑनलाइन मूल्यांकन का परीक्षण किया जाता है: बेंचमार्क सूट (MMLU, HellaSwag, आदि), कार्य-विशिष्ट मेट्रिक्स, LLM-as-a-judge, गोल्डन डेटासेट, A/B टेस्टिंग, और CI में रिग्रेशन गेट्स। प्रश्न व्यावसायिक लक्ष्यों को दर्शाने वाले मेट्रिक्स को चुनने और मॉडल या प्रॉम्प्ट परिवर्तन के बाद गुणवत्ता में बदलाव का पता लगाने पर जोर देते हैं।
7% भारित। इसमें LLM सेवाओं के लिए ऑब्ज़र्वेबिलिटी शामिल है: विलंबता/थ्रूपुट/एरर SLIs, DCGM और Prometheus के माध्यम से GPU और KV-cache का उपयोग, रिक्वेस्ट ट्रेसिंग, कैनरी और ब्लू-ग्रीन रोलआउट, ग्रेसफुल डिग्रेडेशन और घटना प्रतिक्रिया। अलर्टिंग थ्रेशोल्ड, ऑटोस्केलिंग ट्रिगर्स और रोलबैक रणनीति पर प्रश्न अपेक्षित हैं जब कोई डिप्लॉयमेंट प्रतिगामी हो जाता है।
6% भारित। इसमें ट्रांसफार्मर के आंतरिक भाग शामिल हैं: अटेंशन वेरिएंट (MHA, MQA, GQA, FlashAttention), पोजीशनल एन्कोडिंग (RoPE, ALiBi), नॉर्मलाइजेशन, MoE रूटिंग, कॉन्टेक्स्ट-लेंथ एक्सटेंशन, और मॉडल परिवारों के पीछे के आर्किटेक्चरल लीवर्स। प्रश्न आर्किटेक्चर विकल्पों को मेमोरी, थ्रूपुट और गुणवत्ता परिणामों से जोड़ते हैं।
5% पर सबसे हल्का डोमेन लेकिन फिर भी परीक्षणीय। इसमें गार्डरेल्स (NeMo Guardrails), सामग्री फ़िल्टरिंग, जेलब्रेक और प्रॉम्प्ट-इंजैक्शन डिफेन्स, बायस और विषाक्तता मूल्यांकन, डेटा गवर्नेंस और नियामक जागरूकता शामिल है। डिप्लॉय किए गए मॉडल के चारों ओर इनपुट/आउटपुट रेल्स को लेयर करने और जिम्मेदार-AI दस्तावेज़ीकरण पर प्रश्नों की अपेक्षा करें।
$135k–$180k–$245k USD वार्षिक
यह रेंज अमेरिका-आधारित LLM/इनफेरेंस और ML-प्लेटफॉर्म भूमिकाओं को दर्शाती है जहाँ उत्पादन GPU ऑप्टिमाइजेशन और LLM सर्विंग प्राथमिक कौशल हैं। गैर-तटीय और मध्य-स्तरीय भूमिकाएं निचले सिरे की ओर बढ़ती हैं; अग्रणी-AI लैब और अच्छी तरह से वित्त पोषित स्टार्टअप्स में वरिष्ठ LLM-इन्फ्रास्ट्रक्चर इंजीनियर ऊपरी सिरे ($260k-$400k+ TC) से अधिक कमाते हैं। यह प्रमाण-पत्र एक मजबूत कौशल संकेत है, लेकिन इसे अकेले नहीं, बल्कि शिप किए गए उत्पादन प्रणालियों के साथ तोला जाता है।
स्रोत: levels.fyi 2025-2026, U.S. BLS OEWS May 2024, Glassdoor 2025. आंकड़े अनुमानित हैं; वास्तविक मुआवजा भूमिका, क्षेत्र और अनुभव पर निर्भर करता है।
2025-2026 के माध्यम से इंजीनियरों की मांग तेजी से बढ़ी है जो एक LLM को एक चेकपॉइंट से लागत-कुशल, कम-विलंबता वाली उत्पादन सेवा में बदल सकते हैं, क्योंकि संगठन प्रोटोटाइप से डिप्लॉय किए गए GenAI की ओर बढ़ रहे हैं। नौकरी के विज्ञापनों में तेजी से "TensorRT-LLM," "vLLM/Triton," "quantization," "LoRA/QLoRA," और "NIM" को आवश्यक कौशल के रूप में सूचीबद्ध किया जा रहा है, और NVIDIA-विशिष्ट टूलिंग उन जगहों पर दिखाई देती है जहाँ टीमें H100/Blackwell हार्डवेयर पर चलती हैं। NCP-GENL इस अंतर पर ठीक से स्थित है: यह ऑप्टिमाइजेशन-और-डिप्लॉयमेंट विशेषज्ञता को प्रमाणित करता है जो सामान्य प्रॉम्प्ट-इंजीनियरिंग या मॉडल-उपयोग कौशल की तुलना में दुर्लभ और बेहतर-मुआवजा प्राप्त है। यह उन इंजीनियरों के लिए सबसे मूल्यवान है जो पहले से ही बड़े पैमाने पर GPU इनफेरेंस संचालित कर रहे हैं, जहाँ यह व्यावहारिक NVIDIA-स्टैक अनुभव को औपचारिक रूप देता है जिसकी भर्ती प्रबंधक सक्रिय रूप से तलाश करते हैं।
NVIDIA कोई अनिवार्य पूर्व-आवश्यकताएँ सूचीबद्ध नहीं करता है, लेकिन NCP-GENL एक पेशेवर परीक्षा है जो वास्तविक उत्पादन अनुभव मानती है। उम्मीदवारों के पास LLMs को बनाने, फाइन-ट्यून करने या सर्व करने का लगभग एक से दो साल का अनुभव होना चाहिए और उन्हें Python और PyTorch इकोसिस्टम में पारंगत होना चाहिए। NVIDIA पेशेवर स्तर का प्रयास करने से पहले सहयोगी-स्तर के NCA-GENL सामग्री के साथ पूर्व-परिचय की सिफारिश करता है।
NVIDIA GenAI स्टैक से व्यावहारिक परिचितता प्रभावी रूप से आवश्यक है: प्रशिक्षण/फाइन-ट्यूनिंग के लिए NeMo, ऑप्टिमाइज़्ड इनफेरेंस के लिए TensorRT-LLM, सर्विंग के लिए Triton Inference Server और NIM, और GPU ऑब्ज़र्वेबिलिटी के लिए DCGM/Nsight। आपको मल्टी-GPU पैरेललिज़्म, quantization ट्रेड-ऑफ़ और CUDA-स्तर के प्रदर्शन के बारे में तर्क करने में सक्षम होना चाहिए। जिन उम्मीदवारों ने डिप्लॉयमेंट और ऑप्टिमाइजेशन के मालिक हुए बिना केवल होस्टेड LLM APIs का उपयोग किया है, उन्हें यह परीक्षा अपने भारित महत्व से काफी कठिन लगेगी।
NCP-GENL एक वास्तव में मांग वाली पेशेवर परीक्षा है। प्रश्न परिदृश्य-आधारित होते हैं और अक्सर ऐसे ट्रेड-ऑफ़ को मजबूर करते हैं जो डोमेन में फैले होते हैं — उदाहरण के लिए, FP8 बनाम INT4 quantization चुनना, साथ ही tensor-पैरेलल डिग्री, KV-cache मेमोरी और एक विलंबता SLO का भी वजन करना। कोई लैब नहीं हैं, लेकिन मल्टीपल-चॉइस आइटम यह मानते हैं कि आपने वास्तव में TensorRT-LLM इंजन बनाए हैं, Triton/NIM कॉन्फ़िगर किए हैं, और LoRA रन को ट्यून किया है, न कि केवल उनके बारे में पढ़ा है।
सामान्य बाधाओं में ऑप्टिमाइजेशन और GPU-एक्सेलरेशन डोमेन (जो मिलकर ~31% भार वहन करते हैं), सिंगल-GPU मेमोरी से अधिक वाले मॉडल के लिए पैरेललिज़्म रणनीति, और सामान्य LLM अवधारणाओं से NVIDIA-स्टैक विशिष्टताओं को अलग करना शामिल है। यदि आप पहले से ही उत्पादन में LLMs संचालित करते हैं तो लगभग 40-70 घंटे के अध्ययन की योजना बनाएं, और अन्यथा काफी अधिक। $200 शुल्क और ऑनलाइन Certiverse प्रॉक्टरिंग शेड्यूलिंग और रिटेक को सीधा बनाते हैं; दो साल की वैधता तेजी से बदलते NVIDIA टूलचेन के साथ प्रमाण-पत्र को वर्तमान रखती है।
पेशेवर-स्तरीय जनरेटिव AI LLMs परीक्षा। परिदृश्य-आधारित मल्टीपल-चॉइस, ~70% पास (700/1000), $200 USD, Certiverse के माध्यम से ऑनलाइन वितरित, दो साल की वैधता। इसमें मॉडल ऑप्टिमाइजेशन, GPU एक्सेलरेशन, प्रॉम्प्ट इंजीनियरिंग, फाइन-ट्यूनिंग, डेटा प्रिपरेशन, डिप्लॉयमेंट (NIM/Triton/TensorRT-LLM), मूल्यांकन, उत्पादन मॉनिटरिंग, LLM आर्किटेक्चर, और सुरक्षा/नैतिकता/अनुपालन शामिल हैं।
NCP-GENL (NVIDIA-Certified Professional: Generative AI LLMs) एक एक चुनौतीपूर्ण, परिदृश्य-भारी परीक्षा जिसके लिए गहन व्यावहारिक अनुभव और वास्तुशिल्प व्यापार-बंद निर्णय लेने की क्षमता की आवश्यकता होती है Professional-स्तरीय परीक्षा है। प्रोफेशनल और विशेषज्ञ-स्तरीय परीक्षाओं के लिए अधिकांश उम्मीदवारों को 3-6 महीनों में फैले 150-300 घंटे के अध्ययन की आवश्यकता होती है। इन परीक्षाओं में आमतौर पर पूर्व एसोसिएट-स्तर की दक्षता की उम्मीद की जाती है। अधिकांश उम्मीदवार जो अभ्यास परीक्षाओं में उत्तीर्ण होने की सीमा से लगातार ऊपर स्कोर करते हैं, वे अपने पहले प्रयास में उत्तीर्ण हो जाते हैं।
प्रोफेशनल और विशेषज्ञ-स्तरीय परीक्षाओं के लिए अधिकांश उम्मीदवारों को 3-6 महीनों में फैले 150-300 घंटे के अध्ययन की आवश्यकता होती है। इन परीक्षाओं में आमतौर पर पूर्व एसोसिएट-स्तर की दक्षता की उम्मीद की जाती है। उत्तीर्ण होने में लगने वाला समय पूर्व अनुभव के आधार पर व्यापक रूप से भिन्न होता है। अंतर्निहित तकनीक में व्यावहारिक उत्पादन अनुभव वाले इंजीनियरों को आमतौर पर कम समय लगता है; प्लेटफ़ॉर्म के लिए नए उम्मीदवारों को उस सीमा के ऊपरी छोर की ओर योजना बनानी चाहिए।
NCP-GENL NVIDIA इकोसिस्टम में एक मान्यता प्राप्त क्रेडेंशियल है और नियोक्ताओं, भर्तीकर्ताओं और ग्राहकों को मान्य ज्ञान का संकेत देता है। क्या यह आपके लिए समय और शुल्क के लायक है, यह आपकी भूमिका और लक्ष्यों पर निर्भर करता है - यह क्लाउड इंजीनियरों, आर्किटेक्ट्स और सलाहकारों के लिए सबसे अधिक फायदेमंद होता है जो NVIDIA के साथ प्रतिदिन काम करते हैं या उन भूमिकाओं में जाना चाहते हैं।
NCP-GENL के लिए उत्तीर्ण अंक 70% है। परीक्षा में 60 प्रश्न होते हैं और यह 2 घंटा तक चलती है।
NCP-GENL परीक्षा का शुल्क $200 USD है। शुल्क NVIDIA द्वारा निर्धारित किए जाते हैं और क्षेत्र के अनुसार भिन्न हो सकते हैं; बुकिंग से पहले हमेशा आधिकारिक NVIDIA प्रमाणन पृष्ठ पर वर्तमान कीमत की पुष्टि करें।
NVIDIA certifications are valid for 2 years. Renew by passing the current (or a higher-level) exam in the track before expiration.
हाँ, NVIDIA प्रमाणन केवल ऑनलाइन दिए जाते हैं — कोई व्यक्तिगत परीक्षण केंद्र नहीं हैं। परीक्षा एक सुरक्षित प्रोक्टर्ड ब्राउज़र में चलती है; आपको एक शांत निजी कमरा, वेबकैम, माइक्रोफ़ोन, स्थिर ब्रॉडबैंड और एक सरकारी फोटो पहचान पत्र की आवश्यकता होगी।
CertLabPro NCP-GENL के लिए अभ्यास प्रश्न बैंक में 15 अध्ययन मोड प्रदान करता है। परीक्षा-सिमुलेशन मोड वास्तविक परीक्षा को दर्शाता है: 2 घंटा में 60 प्रश्न, 70% की समान उत्तीर्ण सीमा के साथ। ब्राउज़ मोड आपको प्रत्येक प्रश्नोत्तर को स्थिर रूप से पढ़ने की अनुमति देता है।