NVIDIA-Certified Professional: Generative AI LLMs
255 שאלות תרגול
נבדק לאחרונה: April 2026
הערות אישיות וקישורים למשאבים למסע הלמידה שלך
סנן לפי הסמכה
ההסמכה NVIDIA-Certified Professional: Generative AI LLMs (NCP-GENL) היא הסמכה ברמה מקצועית המאשרת את היכולת לבצע אופטימיזציה, כוונון עדין (fine-tune), פריסה והפעלה של מודלי שפה גדולים (LLMs) בקנה מידה רחב על תשתית מואצת של NVIDIA. היא מיועדת למהנדסי ML, מהנדסי LLM/inference, ומומחי MLOps האחראים על מחזור החיים המלא: quantization וקומפילציית TensorRT-LLM, מקביליות multi-GPU, כוונון עדין LoRA/QLoRA/RLHF עם NeMo, פריסה על H100/Blackwell באמצעות NIM ו-Triton, בנוסף להערכה, נראות (observability) ובטיחות. המבחן, המועבר באופן מקוון דרך Certiverse, עשיר בתרחישים ומניח ניסיון מעשי בסביבת ייצור ולא רק לימוד קורסים. עם רף מעבר של כ-70% (700/1000), עמלה של 200 דולר ותוקף לשנתיים, הוא ממוקם בבירור מעל רמת ה-NCA-GENL למתחילים, הן בעומק והן בקפדנות התפעולית.
התחום הכבד ביותר, 17%. מכסה quantization לאחר אימון (INT8, FP8, INT4/AWQ, GPTQ) לעומת אימון מודע ל-quantization, אופטימיזציית KV-cache, גיזום והגמלה של משקולות (weight pruning and distillation), ובניית מנוע TensorRT-LLM עם batching תוך כדי תנועה (in-flight/continuous). צפו לשאלות פשרה השוקלות latency, throughput, טביעת רגל זיכרון (memory footprint) וירידה בדיוק, ומתי FP8 על Hopper/Blackwell עולה על INT8.
משקל 14%. בודק מקביליות tensor/pipeline/sequence, sharding מרובה GPUs ומרובה צמתים (multi-node), מודעות לטופולוגיית NVLink/NVSwitch ו-InfiniBand, CUDA Graphs, דיוק מעורב (mixed precision), ופרופיל ניצול GPU עם Nsight ו-DCGM. השאלות בוחנות כיצד להגדיל מודל שחורג מזיכרון של GPU יחיד וכיצד לאבחן צווארי בקבוק המוגבלים בתקשורת לעומת מוגבלים בחישוב.
משקל 13%. חורג מהבסיס ל-prompting בסביבת ייצור: עיצוב few-shot ו-chain-of-thought, פלט מובנה/מוגבל ל-JSON, ניהול גרסאות של system-prompt, prompting מועשר באמצעות שליפה (retrieval-augmented prompting), ומודעות ל-prompt-injection. צפו לתרחישים על הפחתת עלות טוקנים ו-latency תוך שמירה על איכות התשובה, ועל פענוח מודרך (guided decoding) עבור פלט מוגבל סכימה.
משקל 13%. מכסה fine-tuning מלא לעומת שיטות יעילות פרמטרים (LoRA, QLoRA, P-tuning, adapters), איסוף נתוני SFT, יישור RLHF/DPO, זרימות עבודה של NeMo ו-NeMo Customizer, והפחתת שכחה קטסטרופלית (catastrophic-forgetting). השאלות בודקות מתי LoRA מספיק, כיצד למזג adapters לצורך inference, וכיצד לקבוע גודל rank, learning rate ו-dataset למשימה נתונה.
משקל 9%. מתמקד באיסוף קורפוס לאימון מוקדם/fine-tuning, הסרת כפילויות (deduplication), סינון איכות, בחירת tokenization ואוצר מילים, עיצוב dataset עבור NeMo, ניקוי PII, וטיהור נגד מערכי הערכה. צפו לשאלות על בניית צינורות נתונים ניתנים לשחזור ומנוהלים, ועל השפעת איכות הנתונים על התנהגות המודל במורד הזרם.
משקל 9%. מכסה הגשה (serving) עם מיקרו-שירותי NVIDIA NIM, backends של Triton Inference Server, תצורת זמן ריצה של TensorRT-LLM, autoscaling, הגשה מרובת מודלים וקונקרנטית, ונקודות קצה תואמות OpenAI. צפו לשאלות תרחיש על בחירת NIM לעומת הרכב Triton מותאם אישית, קביעת תצורה של dynamic batching, ועמידה ב-SLOs של latency תחת עומס משתנה.
משקל 7%. בודק הערכה מקוונת ולא מקוונת: חבילות benchmark (MMLU, HellaSwag, וכו'), מדדים ספציפיים למשימה, LLM-as-a-judge, golden datasets, בדיקות A/B, ו-regression gates ב-CI. השאלות מדגישות בחירת מדדים המשקפים יעדים עסקיים ואיתור סחף איכותי לאחר שינוי מודל או prompt.
משקל 7%. מכסה נראות (observability) לשירותי LLM: SLIs של latency/throughput/error, ניצול GPU ו-KV-cache באמצעות DCGM ו-Prometheus, עקיבת בקשות (request tracing), פריסות canary ו-blue-green, ירידת ביצועים הדרגתית (graceful degradation), ותגובה לתקריות. צפו לשאלות על ספי התראה, טריגרים של autoscaling, ואסטרטגיית חזרה לאחור (rollback) כאשר פריסה נסוגה.
משקל 6%. מכסה את הפנימיות של transformer: וריאציות attention (MHA, MQA, GQA, FlashAttention), קידודי מיקום (RoPE, ALiBi), נורמליזציה, ניתוב MoE, הרחבת אורך הקונטקסט, ומנופי הארכיטקטורה מאחורי משפחות מודלים. השאלות מקשרות בחירות ארכיטקטורה לזיכרון, throughput ותוצאות איכותיות.
התחום הקל ביותר, 5% אך עדיין ניתן לבחינה. מכסה guardrails (NeMo Guardrails), סינון תוכן, הגנה מפני jailbreak ו-prompt-injection, הערכת הטיה ורעילות, ממשל נתונים, ומודעות רגולטורית. צפו לשאלות על שכבות input/output rails סביב מודל פרוס ועל תיעוד AI אחראי.
$135k–$180k–$245k USD שנתי
הטווח משקף תפקידי LLM/inference ופלטפורמת ML בארה"ב, שבהם אופטימיזציית GPU בסביבת ייצור והגשת LLM הם כישורים עיקריים. תפקידים שאינם באזורי חוף ותפקידי ביניים נוטים לכיוון הקצה התחתון; מהנדסי תשתית LLM בכירים במעבדות AI חלוציות ובסטארטאפים ממומנים היטב חורגים מהקצה העליון (TC של $260k-$400k+). ההסמכה היא אות חזק לכישורים אך נשקלת יחד עם מערכות ייצור שנשלחו, לא בפני עצמה.
מקור: מקורות: levels.fyi 2025-2026, U.S. BLS OEWS מאי 2024, Glassdoor 2025. הנתונים משוערים; התגמול בפועל תלוי בתפקיד, באזור ובניסיון.
הדרישה למהנדסים שיכולים לקחת LLM מנקודת ביקורת (checkpoint) לשירות ייצור חסכוני ובעל latency נמוך עלתה בחדות במהלך 2025-2026, כאשר ארגונים עוברים מאבות טיפוס ל-GenAI פרוס. מודעות דרושים מציינות יותר ויותר "TensorRT-LLM", "vLLM/Triton", "quantization", "LoRA/QLoRA", ו-"NIM" ככישורים נדרשים, וכלי NVIDIA ספציפיים מופיעים בכל מקום שבו צוותים פועלים על חומרת H100/Blackwell. ה-NCP-GENL ממוקם בדיוק בפער זה: הוא מאשר את המומחיות באופטימיזציה ופריסה שהיא נדירה ומתוגמלת טוב יותר מכישורי prompt-engineering או שימוש במודלים גנריים. הוא בעל ערך רב ביותר למהנדסים שכבר מפעילים GPU inference בקנה מידה רחב, שם הוא ממסד ניסיון מעשי עם ערימת NVIDIA שמנהלי גיוס בודקים באופן פעיל.
NVIDIA אינה מפרטת דרישות קדם חובה, אך NCP-GENL הוא מבחן מקצועי המניח ניסיון אמיתי בסביבת ייצור. מועמדים צריכים להיות בעלי כשנה עד שנתיים של בנייה, fine-tuning או הגשה של LLMs, ולשלוט ב-Python ובמערכת האקולוגית של PyTorch. NVIDIA ממליצה על היכרות קודמת עם חומר ה-NCA-GENL ברמת ה-associate כבסיס לפני ניסיון לרמה המקצועית.
היכרות מעשית עם ערימת ה-NVIDIA GenAI נדרשת למעשה: NeMo לאימון/fine-tuning, TensorRT-LLM ל-inference אופטימלי, Triton Inference Server ו-NIM להגשה, ו-DCGM/Nsight לנראות GPU. עליכם להיות מסוגלים להבין מקביליות multi-GPU, פשרות quantization, וביצועים ברמת CUDA. מועמדים שרק צרכו LLM APIs מתארחים מבלי להיות אחראים על פריסה ואופטימיזציה ימצאו את המבחן קשה באופן משמעותי ממה שמשתמע ממשקלו.
NCP-GENL הוא מבחן מקצועי תובעני באמת. השאלות מבוססות תרחישים ולעתים קרובות מאלצות פשרות המשתרעות על פני תחומים – לדוגמה, בחירת FP8 לעומת INT4 quantization תוך כדי שקילת דרגת tensor-parallel, זיכרון KV-cache, ו-SLO של latency. אין מעבדות, אך פריטי הבחירה מרובה מניחים שאכן בניתם מנועי TensorRT-LLM, הגדרתם Triton/NIM, וכיילתם הרצות LoRA ולא רק קראתם עליהם.
מכשולים נפוצים כוללים את תחומי האופטימיזציה והאצת ה-GPU (אשר יחד נושאים כ-31% מהמשקל), אסטרטגיית מקביליות למודלים החורגים מזיכרון של GPU יחיד, והבחנה בין הפרטים הספציפיים של ערימת NVIDIA לבין מושגי LLM גנריים. תכננו כ-40-70 שעות לימוד אם אתם כבר מפעילים LLMs בסביבת ייצור, ויותר מכך באופן משמעותי אחרת. העמלה של 200 דולר והפיקוח המקוון של Certiverse הופכים את קביעת לוחות הזמנים והבחינות החוזרות לפשוטים; תוקף לשנתיים שומר על ההסמכה עדכנית עם מערך הכלים המהיר של NVIDIA.
מבחן Generative AI LLMs ברמה מקצועית. בחירה מרובה מבוססת תרחישים, ~70% מעבר (700/1000), 200 דולר ארה"ב, מועבר באופן מקוון דרך Certiverse, תוקף לשנתיים. מכסה אופטימיזציית מודלים, האצת GPU, prompt engineering, fine-tuning, הכנת נתונים, פריסה (NIM/Triton/TensorRT-LLM), הערכה, ניטור ייצור, ארכיטקטורת LLM, ובטיחות/אתיקה/ציות.
NCP-GENL (NVIDIA-Certified Professional: Generative AI LLMs) הוא מבחן ברמת Professional מבחן מאתגר ועשיר בתרחישים הדורש ניסיון מעמיק ויכולת לקבל החלטות על פשרות אדריכליות. רוב המועמדים זקוקים ל-150–300 שעות לימוד הפרוסות על פני 3–6 חודשים עבור מבחני רמת מקצועי ומומחה. מבחנים אלו מצפים בדרך כלל למיומנות קודמת ברמת Associate. רוב המועמדים שמקבלים ציונים באופן עקבי מעל סף המעבר במבחני תרגול עוברים בניסיון הראשון.
רוב המועמדים זקוקים ל-150–300 שעות לימוד הפרוסות על פני 3–6 חודשים עבור מבחני רמת מקצועי ומומחה. מבחנים אלו מצפים בדרך כלל למיומנות קודמת ברמת Associate. משך הזמן למעבר משתנה מאוד בהתאם לניסיון קודם. מהנדסים בעלי ניסיון מעשי בסביבת ייצור בטכנולוגיה הבסיסית זקוקים בדרך כלל לפחות זמן; מועמדים חדשים לפלטפורמה צריכים לתכנן את לימודיהם לכיוון הקצה העליון של טווח זה.
NCP-GENL הוא אישור מוכר במערכת האקולוגית של NVIDIA ומסמן ידע מאומת למעסיקים, מגייסים ולקוחות. האם זה שווה את הזמן והעמלה עבורך תלוי בתפקיד ובמטרות שלך – זה נוטה להשתלם ביותר עבור מהנדסי ענן, אדריכלים ויועצים שעובדים עם NVIDIA על בסיס יומיומי או רוצים לעבור לתפקידים כאלה.
ציון המעבר עבור NCP-GENL הוא 70%. המבחן מכיל 60 שאלות ונמשך 2 שע'.
עמלת מבחן ה-NCP-GENL היא $200 USD. העמלות נקבעות על ידי NVIDIA ועשויות להשתנות לפי אזור; תמיד אשרו את המחיר הנוכחי בדף ההסמכה הרשמי של NVIDIA לפני ההזמנה.
NVIDIA certifications are valid for 2 years. Renew by passing the current (or a higher-level) exam in the track before expiration.
כן, הסמכות NVIDIA ניתנות באופן מקוון בלבד – אין מרכזי בחינה פיזיים. הבחינה מתבצעת בדפדפן מאובטח ומפוקח; תזדקק לחדר שקט ופרטי, מצלמת אינטרנט, מיקרופון, חיבור פס רחב יציב ותעודת זיהוי ממשלתית עם תמונה.
CertLabPro מספק 15 מצבי לימוד על פני בנק השאלות לתרגול עבור NCP-GENL. מצב סימולציית המבחן משקף את המבחן האמיתי: 60 שאלות ב-2 שע', עם אותו סף מעבר של 70%. מצב עיון מאפשר לך לקרוא כל שאלה ותשובה באופן סטטי.