NVIDIA-Certified Professional: Generative AI LLMs
255問の練習問題
最終確認:April 2026
学習のための個人ノートとリソースリンク
認定でフィルター
NVIDIA-Certified Professional: Generative AI LLMs (NCP-GENL) は、NVIDIA アクセラレーテッドインフラストラクチャ上で大規模な大規模言語モデル (LLM) を最適化、ファインチューニング、デプロイ、および運用する能力を検証するプロフェッショナルレベルの認定資格です。この資格は、量子化と TensorRT-LLM コンパイル、マルチ GPU 並列処理、NeMo を用いた LoRA/QLoRA/RLHF ファインチューニング、NIM および Triton を介した H100/Blackwell へのデプロイ、さらに評価、可観測性、および安全性といった、LLM のライフサイクル全体を担う ML エンジニア、LLM/推論エンジニア、および MLOps 担当者を対象としています。Certiverse を通じてオンラインで提供されるこの試験は、シナリオ問題が中心で、座学ではなく実践的な本番環境での経験を前提としています。合格基準は約70% (1000点中700点)、受験料200ドル、2年間の有効期限を持つこの資格は、深さと運用面での厳格さの両方において、アソシエイトレベルの NCA-GENL を明確に上回ります。
17%を占める最も重要なドメインです。推論後の量子化 (INT8, FP8, INT4/AWQ, GPTQ) と量子化対応トレーニングの比較、KV-cache 最適化、重み剪定と蒸留、in-flight (連続) バッチ処理による TensorRT-LLM エンジンの構築をカバーします。レイテンシー、スループット、メモリフットプリント、精度低下を考慮したトレードオフに関する質問や、Hopper/Blackwell 上で FP8 が INT8 を上回る状況について出題されます。
14%のウェイトです。テンソル/パイプライン/シーケンス並列処理、マルチ GPU およびマルチノードシャーディング、NVLink/NVSwitch および InfiniBand のトポロジー認識、CUDA Graphs、混合精度、Nsight および DCGM を使用した GPU 使用率プロファイリングをテストします。シングル GPU メモリを超えるモデルをどのようにスケールさせるか、また通信ボトルネックと計算ボトルネックをどのように診断するかに関する質問が出題されます。
13%のウェイトです。基本を超えて、本番環境でのプロンプティングに焦点を当てます。few-shot および chain-of-thought 設計、構造化/JSON 制約付き出力、システムプロンプトのバージョン管理、Retrieval-Augmented Prompting (RAG)、プロンプトインジェクションの認識についてカバーします。回答の品質を維持しながらトークンコストとレイテンシーを削減するシナリオや、スキーマに準拠した出力のためのガイド付きデコーディングに関するシナリオが出題されます。
13%のウェイトです。フルファインチューニングとパラメータ効率の良い手法 (LoRA, QLoRA, P-tuning, アダプター) の比較、SFT データキュレーション、RLHF/DPO アライメント、NeMo および NeMo Customizer ワークフロー、壊滅的忘却の軽減をカバーします。LoRA で十分なケース、推論用アダプターの結合方法、およびターゲットタスクに対するランク、学習率、データセットのサイズ設定方法に関する質問が出題されます。
9%のウェイトです。事前学習/ファインチューニングコーパスのキュレーション、重複排除、品質フィルタリング、トークン化と語彙の選択、NeMo 用データセットフォーマット、PII 除去、評価セットに対する汚染除去に焦点を当てます。再現可能で管理されたデータパイプラインの構築や、データ品質が下流のモデル動作に与える影響に関する質問が出題されます。
9%のウェイトです。NVIDIA NIM マイクロサービス、Triton Inference Server バックエンド、TensorRT-LLM ランタイム設定、オートスケーリング、マルチモデルおよび同時サービング、OpenAI 互換エンドポイントを使用したサービングをカバーします。NIM とカスタム Triton アンサンブルの選択、動的バッチ処理の設定、可変負荷下でのレイテンシー SLO の達成に関するシナリオ問題が出題されます。
7%のウェイトです。オフラインおよびオンライン評価をテストします。ベンチマークスイート (MMLU, HellaSwag など)、タスク固有のメトリクス、LLM-as-a-judge、ゴールデンデータセット、A/B テスト、CI における回帰ゲートをカバーします。ビジネス目標を反映するメトリクスの選択や、モデルまたはプロンプト変更後の品質ドリフトの検出に重点が置かれます。
7%のウェイトです。LLM サービスの可観測性をカバーします。レイテンシー/スループット/エラー SLI、DCGM および Prometheus を介した GPU および KV-cache 使用率、リクエストトレース、カナリアおよびブルー/グリーンデプロイ、グレースフルデグラデーション、インシデント対応についてです。アラートしきい値、オートスケーリングトリガー、デプロイが後退した場合のロールバック戦略に関する質問が出題されます。
6%のウェイトです。トランスフォーマーの内部構造をカバーします。アテンションのバリアント (MHA, MQA, GQA, FlashAttention)、位置エンコーディング (RoPE, ALiBi)、正規化、MoE ルーティング、コンテキスト長拡張、およびモデルファミリーの背後にあるアーキテクチャ的要素についてです。アーキテクチャの選択とメモリ、スループット、品質の結果との関連付けに関する質問が出題されます。
5%と最もウェイトの低いドメインですが、それでも出題されます。ガードレール (NeMo Guardrails)、コンテンツフィルタリング、ジェイルブレイクとプロンプトインジェクション防御、バイアスと毒性の評価、データガバナンス、規制意識についてカバーします。デプロイされたモデルの周囲に入出力ガードレールを層状に配置することや、責任ある AI ドキュメントに関する質問が出題されます。
$135k–$180k–$245k USD 年収
この範囲は、米国を拠点とする LLM/推論および ML プラットフォームの職種で、本番環境での GPU 最適化と LLM サービングが主要スキルである場合を反映しています。非沿岸部および中堅レベルの職種は下限に近く、最先端の AI ラボや資金豊富なスタートアップのシニア LLM インフラストラクチャエンジニアは上限 ($260k~$400k+ TC) を超えます。この認定資格は強力なスキルシグナルですが、それ単独ではなく、出荷された本番システムと合わせて評価されます。
出典: levels.fyi 2025-2026年、米国労働統計局 OEWS 2024年5月、Glassdoor 2025年。数値は概算であり、実際の報酬は職務、地域、経験によって異なります。
組織がプロトタイプからデプロイされた GenAI へと移行するにつれて、チェックポイントから費用対効果が高く、低レイテンシーの本番サービスへと LLM を移行できるエンジニアの需要は、2025年から2026年にかけて急激に高まっています。求人情報では、「TensorRT-LLM」、「vLLM/Triton」、「quantization」、「LoRA/QLoRA」、「NIM」が必須スキルとしてリストアップされることが増え、チームが H100/Blackwell ハードウェアで稼働している場所ではどこでも NVIDIA 固有のツールが出現します。NCP-GENL はまさにこのギャップに位置しています。一般的なプロンプトエンジニアリングやモデル使用のスキルよりも稀少で報酬の高い、最適化とデプロイの専門知識を認定します。これは、すでに大規模な GPU 推論を運用しているエンジニアにとって最も価値があり、採用マネージャーが積極的に求める実践的な NVIDIA スタックの経験を公式に証明するものです。
NVIDIA は必須の前提条件を挙げていませんが、NCP-GENL は実際の本番経験を前提とするプロフェッショナル試験です。受験者は、LLM の構築、ファインチューニング、またはサービングに約1〜2年の経験があり、Python および PyTorch エコシステムに精通している必要があります。NVIDIA は、プロフェッショナルレベルの受験前に、アソシエイトレベルの NCA-GENL 資料に慣れておくことを基礎として推奨しています。
NVIDIA GenAI スタックの実践的な知識が実質的に必要です。トレーニング/ファインチューニングには NeMo、最適化された推論には TensorRT-LLM、サービングには Triton Inference Server と NIM、GPU の可観測性には DCGM/Nsight を使用します。マルチ GPU 並列処理、量子化のトレードオフ、CUDA レベルのパフォーマンスについて推論できる必要があります。デプロイと最適化を自身で行うことなく、ホスト型 LLM API を利用した経験しかない受験者は、この試験がそのウェイトが示唆するよりもかなり難しいと感じるでしょう。
NCP-GENL は、本当に要求の厳しいプロフェッショナル試験です。問題はシナリオベースであり、複数のドメインにわたるトレードオフを頻繁に要求します。たとえば、FP8 と INT4 量子化のどちらを選択するか、同時にテンソル並列度、KV-cache メモリ、レイテンシー SLO を考慮するなどです。ラボはありませんが、多肢選択問題は、単にそれらについて読んだだけではなく、実際に TensorRT-LLM エンジンを構築し、Triton/NIM を構成し、LoRA の実行をチューニングした経験があることを前提としています。
一般的な課題としては、最適化と GPU 高速化のドメイン (これら2つで合計約31%のウェイトを占めます)、シングル GPU メモリを超えるモデルの並列処理戦略、および NVIDIA スタックの具体的な内容と一般的な LLM の概念を区別することなどがあります。すでに本番環境で LLM を運用している場合は約40〜70時間の学習を計画し、そうでない場合はそれよりも大幅に多くの時間を費やす必要があります。200ドルの受験料とオンラインでの Certiverse 監督により、スケジュール設定と再受験は簡単です。2年間の有効期限により、この資格は急速に進化する NVIDIA ツールチェーンに常に適合した状態を保ちます。
プロフェッショナルレベルの Generative AI LLMs 試験。シナリオベースの多肢選択式で、合格率約70% (1000点中700点)、受験料200米ドル、Certiverse を介してオンラインで提供され、2年間有効。モデル最適化、GPU 高速化、プロンプトエンジニアリング、ファインチューニング、データ準備、デプロイ (NIM/Triton/TensorRT-LLM)、評価、本番監視、LLM アーキテクチャ、安全性/倫理/コンプライアンスをカバー。
NCP-GENL (NVIDIA-Certified Professional: Generative AI LLMs) は、深い実践経験とアーキテクチャ上のトレードオフ決定を行う能力を必要とする、挑戦的でシナリオ中心の試験 Professionalレベルの試験です。ほとんどの受験者は、プロフェッショナルおよびエキスパートレベルの試験に3〜6か月かけて150〜300時間の学習を必要とします。これらの試験は通常、事前の準専門家レベルの習熟度を想定しています。 練習試験で合格基準を安定して上回るスコアを獲得している受験者のほとんどは、初回で合格しています。
ほとんどの受験者は、プロフェッショナルおよびエキスパートレベルの試験に3〜6か月かけて150〜300時間の学習を必要とします。これらの試験は通常、事前の準専門家レベルの習熟度を想定しています。 合格までの時間は、これまでの経験によって大きく異なります。基礎となるテクノロジーでの実践的な本番経験を持つエンジニアは通常、より少ない時間で済みますが、プラットフォームに初めて触れる受験者は、この範囲の上限を目安に計画を立てる必要があります。
NCP-GENLは、NVIDIAエコシステムで認められた資格であり、雇用主、リクルーター、クライアントに検証済みの知識を示します。あなたにとって時間と費用をかける価値があるかどうかは、あなたの役割と目標によります。通常、NVIDIAを日常的に扱っている、またはそのような役割に就きたいと考えているクラウドエンジニア、アーキテクト、コンサルタントにとって最も報われる傾向があります。
NCP-GENLの合格点は70%です。試験には60問の問題が含まれており、所要時間は2 時間です。
NCP-GENL試験の受験料は$200 USDです。受験料はNVIDIAによって設定されており、地域によって異なる場合があります。予約する前に、常にNVIDIAの公式認定ページで現在の価格を確認してください。
NVIDIA certifications are valid for 2 years. Renew by passing the current (or a higher-level) exam in the track before expiration.
はい、NVIDIA認定はオンラインでのみ提供されます。対面式の試験センターはありません。試験はセキュアな監督付きブラウザで実行されます。静かでプライベートな部屋、ウェブカメラ、マイク、安定したブロードバンド、および政府発行の写真付き身分証明書が必要です。
CertLabProでは、NCP-GENLの練習問題バンクで15の学習モードを提供しています。試験シミュレーションモードは、実際の試験を反映しており、2 時間で60問、合格基準は70%と同じです。ブラウズモードでは、すべてのQ&Aを静的に読むことができます。