NCP-GENL

Modo Exame

60 perguntas aleatórias
Cronômetro de 120 minutos
Pontuação no final (aprovação: 700/1000)
Simula o exame real

📘

Guia

Padrões cenário → solução
Agrupado por domínio do exame
Completo e gratuito na web e no celular
Pura referência — sem perguntas, sem pontuação

Modo Prática

Todas as 255 perguntas
Sem limite de tempo
Feedback instantâneo após cada resposta
Aprenda no seu próprio ritmo

📑

Modo Navegação

Todas as 255 perguntas em uma página
Respostas e explicações visíveis
Revisão rápida antes do exame
Role por tudo

🌿

Modo Zen

Uma pergunta por vez
Deslize ou use as setas
Opção de embaralhar disponível
Estudo relaxado tipo flashcard

⚡

Time Attack

Comece com 63 segundos
+10s por resposta correta
-5s por resposta incorreta
Bata seu recorde

❤️

Sobrevivência

Tempo ilimitado
Fim de jogo no primeiro erro
Construa sua sequência
Teste sua consistência

⚩

Modo Blitz

15 segundos por pergunta
Bônus por respostas rápidas
Multiplicador de sequência (2x, 3x...)
Teste de velocidade estilo arcade

🏃

Modo Sprint

Cronômetro ascendente
Acerte 10/25/50 seguidas
Erro reinicia sua sequência
Bata seu melhor tempo pessoal

🎓

Modo Flashcard

Apenas a pergunta, sem opções
Toque para revelar a resposta
Avalie: Sabia / Parcialmente / Não sabia
Perguntas fracas reaparecem antes

Modo Revisão Intensiva

Prioriza perguntas não vistas primeiro
Depois perguntas que você errou
Feedback instantâneo após cada resposta
Acompanhe sua cobertura total

🔥

Desafio de Sequência

Sem pressão de tempo
Acompanhe sua maior sequência
Erro reinicia para zero
Bata seu recorde pessoal

💪

Elo Fraco

Apenas perguntas que você errou
Acerte 3 vezes cada uma para dominar
Acompanhe o progresso de domínio
Elimine seus pontos fracos

Revisão SRS

Revisão diária com repetição espaçada
Perguntas agendadas em intervalos ideais
Avalie: De novo / Difícil / Bom / Fácil
Construa sua sequência de revisão diária

Notas de Estudo

Notas pessoais e links de recursos para sua jornada de estudo

NVIDIA-Certified Professional: Agentic AI

Visão geral

A NVIDIA-Certified Professional: Generative AI LLMs (NCP-GENL) é uma credencial de nível profissional que valida a capacidade de otimizar, fazer fine-tuning, implantar e operar large language models em escala na infraestrutura acelerada da NVIDIA. É voltada para engenheiros de ML, engenheiros de LLM/inferência e profissionais de MLOps que gerenciam o ciclo de vida completo: quantization e compilação TensorRT-LLM, paralelismo multi-GPU, fine-tuning LoRA/QLoRA/RLHF com NeMo, implantação em H100/Blackwell via NIM e Triton, além de avaliação, observabilidade e segurança. Realizado online via Certiverse, o exame é focado em cenários e pressupõe experiência prática em produção, e não apenas em cursos. Com uma pontuação de aprovação de ~70% (700/1000), uma taxa de $200 e validade de dois anos, ele se posiciona claramente acima do nível associado NCA-GENL em profundidade e rigor operacional.

Domínios do exame

Model Optimization17%
O domínio mais pesado, com 17%. Abrange quantization pós-treinamento (INT8, FP8, INT4/AWQ, GPTQ) versus treinamento com conscientização de quantization, otimização de KV-cache, poda e destilação de pesos, e construção de engine TensorRT-LLM com batching in-flight (contínuo). Espere perguntas sobre trade-offs que consideram latência, throughput, consumo de memória e degradação da precisão, e quando FP8 em Hopper/Blackwell supera INT8.
GPU Acceleration and Optimization14%
Com peso de 14%. Testa paralelismo de tensor/pipeline/sequência, sharding multi-GPU e multi-nó, conhecimento da topologia NVLink/NVSwitch e InfiniBand, CUDA Graphs, mixed precision e profiling de utilização de GPU com Nsight e DCGM. As perguntas investigam como escalar um modelo que excede a memória de uma única GPU e como diagnosticar gargalos ligados à comunicação versus ligados ao processamento.
Prompt Engineering13%
Com peso de 13%. Vai além dos fundamentos para prompting de produção: design few-shot e chain-of-thought, saída estruturada/restrita a JSON, versionamento de system-prompt, retrieval-augmented prompting e conscientização sobre prompt-injection. Espere cenários sobre como reduzir o custo e a latência de tokens, preservando a qualidade da resposta, e sobre decodificação guiada para saída vinculada a esquema.
Fine-Tuning13%
Com peso de 13%. Abrange fine-tuning completo versus métodos eficientes em parâmetros (LoRA, QLoRA, P-tuning, adapters), curadoria de dados SFT, alinhamento RLHF/DPO, workflows NeMo e NeMo Customizer, e mitigação de catastrophic-forgetting. As perguntas testam quando LoRA é suficiente, como mesclar adapters para inferência e como dimensionar rank, taxa de aprendizado e dataset para uma tarefa alvo.
Data Preparation9%
Com peso de 9%. Foca na curadoria de corpus de pré-treinamento/fine-tuning, deduplicação, filtragem de qualidade, escolhas de tokenização e vocabulário, formatação de dataset para NeMo, remoção de PII e descontaminação contra conjuntos de avaliação. Espere perguntas sobre a construção de pipelines de dados reproduzíveis e governados, e sobre o efeito da qualidade dos dados no comportamento do modelo downstream.
Model Deployment9%
Com peso de 9%. Abrange serving com microsserviços NVIDIA NIM, backends do Triton Inference Server, configuração de tempo de execução TensorRT-LLM, autoscaling, serving multi-modelo e concorrente, e endpoints compatíveis com OpenAI. Espere perguntas baseadas em cenários sobre a escolha entre NIM e um ensemble Triton personalizado, configurando batching dinâmico e atendendo aos SLOs de latência sob carga variável.
Evaluation7%
Com peso de 7%. Testa avaliação offline e online: suites de benchmark (MMLU, HellaSwag, etc.), métricas específicas da tarefa, LLM-as-a-judge, golden datasets, teste A/B e regression gates em CI. As perguntas enfatizam a escolha de métricas que reflitam os objetivos de negócio e a detecção de desvio de qualidade após uma alteração no modelo ou prompt.
Production Monitoring and Reliability7%
Com peso de 7%. Abrange observabilidade para serviços LLM: SLIs de latência/throughput/erro, utilização de GPU e KV-cache via DCGM e Prometheus, rastreamento de requisições, rollouts canary e blue-green, degradação graciosa e resposta a incidentes. Espere perguntas sobre limites de alerta, gatilhos de autoscaling e estratégia de rollback quando uma implantação regride.
LLM Architecture6%
Com peso de 6%. Abrange os internos de transformer: variantes de atenção (MHA, MQA, GQA, FlashAttention), positional encodings (RoPE, ALiBi), normalização, roteamento MoE, extensão do comprimento de contexto e as alavancas arquitetônicas por trás das famílias de modelos. As perguntas conectam as escolhas de arquitetura aos resultados de memória, throughput e qualidade.
Safety, Ethics, and Compliance5%
O domínio mais leve, com 5%, mas ainda examinável. Abrange guardrails (NeMo Guardrails), filtragem de conteúdo, defesa contra jailbreak e prompt-injection, avaliação de viés e toxicidade, governança de dados e conscientização regulatória. Espere perguntas sobre a aplicação de rails de entrada/saída em torno de um modelo implantado e sobre documentação de IA responsável.

Impacto na carreira

Cargos típicos

Engenheiro de LLM / Inferência
Engenheiro de Machine Learning (LLMs)
Engenheiro de MLOps / Plataforma de Modelos
Engenheiro de IA Aplicada
Arquiteto de Soluções GenAI

Faixa salarial (EUA, aproximado)

$135k–$180k–$245k USD anual

A faixa reflete funções de LLM/inferência e plataforma de ML baseadas nos EUA, onde a otimização de GPU em produção e o serving de LLM são habilidades primárias. Funções de nível médio e em regiões não costeiras tendem para o extremo inferior; engenheiros seniores de infraestrutura de LLM em laboratórios de IA de ponta e startups bem financiadas excedem o extremo superior ($260k-$400k+ TC). A certificação é um forte sinal de habilidades, mas é considerada em conjunto com sistemas de produção entregues, e não isoladamente.

Fonte: levels.fyi 2025-2026, U.S. BLS OEWS maio de 2024, Glassdoor 2025. Os valores são aproximados; a compensação real depende da função, região e experiência.

Demanda de mercado

A demanda por engenheiros que conseguem levar um LLM de um checkpoint a um serviço de produção de baixo custo e baixa latência aumentou acentuadamente em 2025-2026, à medida que as organizações passam de protótipos para GenAI implantada. As vagas de emprego listam cada vez mais "TensorRT-LLM", "vLLM/Triton", "quantization", "LoRA/QLoRA" e "NIM" como habilidades exigidas, e as ferramentas específicas da NVIDIA aparecem sempre que as equipes operam em hardware H100/Blackwell. O NCP-GENL está posicionado precisamente nessa lacuna: ele certifica a expertise em otimização e implantação que é mais escassa e melhor remunerada do que as habilidades genéricas de prompt-engineering ou uso de modelos. É mais valioso para engenheiros que já operam inferência de GPU em escala, onde formaliza a experiência prática com a pilha NVIDIA que os gerentes de contratação buscam ativamente.

Pré-requisitos e caminho recomendado

A NVIDIA não lista pré-requisitos obrigatórios, mas o NCP-GENL é um exame profissional que pressupõe experiência real em produção. Os candidatos devem ter aproximadamente um a dois anos de experiência na construção, fine-tuning ou serving de LLMs e ser fluentes em Python e no ecossistema PyTorch. A NVIDIA recomenda familiaridade prévia com o material de nível associado NCA-GENL como base antes de tentar o nível profissional.

A familiaridade prática com a pilha NVIDIA GenAI é efetivamente exigida: NeMo para treinamento/fine-tuning, TensorRT-LLM para inferência otimizada, Triton Inference Server e NIM para serving, e DCGM/Nsight para observabilidade de GPU. Você deve ser capaz de raciocinar sobre paralelismo multi-GPU, trade-offs de quantization e desempenho em nível CUDA. Candidatos que apenas consumiram APIs de LLM hospedadas sem possuir o controle da implantação e otimização acharão o exame significativamente mais difícil do que sua ponderação implica.

Dificuldade e tempo de estudo

O NCP-GENL é um exame profissional genuinamente exigente. As perguntas são baseadas em cenários e frequentemente forçam trade-offs que abrangem vários domínios — por exemplo, escolher quantization FP8 versus INT4, enquanto também se considera o grau de paralelismo de tensor, a memória do KV-cache e um SLO de latência. Não há laboratórios, mas os itens de múltipla escolha pressupõem que você realmente construiu engines TensorRT-LLM, configurou Triton/NIM e ajustou execuções LoRA, em vez de apenas ter lido sobre eles.

Os obstáculos comuns incluem os domínios de otimização e aceleração de GPU (que juntos carregam ~31% do peso), a estratégia de paralelismo para modelos que excedem a memória de uma única GPU, e a distinção entre especificidades da pilha NVIDIA e conceitos genéricos de LLM. Planeje aproximadamente 40-70 horas de estudo se você já opera LLMs em produção, e consideravelmente mais caso contrário. A taxa de $200 e a supervisão online do Certiverse tornam o agendamento e as repetições diretos; a validade de dois anos mantém a credencial atualizada com o rápido avanço do conjunto de ferramentas NVIDIA.

Histórico de versões do exame

NCP-GENL2025-01
Exame de nível profissional para Generative AI LLMs. Múltipla escolha baseada em cenários, aprovação de ~70% (700/1000), $200 USD, realizado online via Certiverse, validade de dois anos. Abrange otimização de modelo, aceleração de GPU, prompt engineering, fine-tuning, preparação de dados, implantação (NIM/Triton/TensorRT-LLM), avaliação, monitoramento de produção, arquitetura de LLM e segurança/ética/conformidade.

Perguntas frequentes

Qual é a dificuldade do exame NCP-GENL?

NCP-GENL (NVIDIA-Certified Professional: Generative AI LLMs) é um exame de nível Professional um exame desafiador, com muitos cenários, que exige profunda experiência prática e a capacidade de tomar decisões de trade-off arquitetônicas. A maioria dos candidatos precisa de 150 a 300 horas de estudo distribuídas em 3 a 6 meses para exames de nível profissional e especialista. Esses exames geralmente esperam proficiência anterior em nível associado. A maioria dos candidatos que pontuam consistentemente acima do limite de aprovação em exames práticos é aprovada na primeira tentativa.

Quanto tempo devo estudar para NCP-GENL?

A maioria dos candidatos precisa de 150 a 300 horas de estudo distribuídas em 3 a 6 meses para exames de nível profissional e especialista. Esses exames geralmente esperam proficiência anterior em nível associado. O tempo para aprovação varia amplamente de acordo com a experiência prévia. Engenheiros com experiência prática de produção na tecnologia subjacente geralmente precisam de menos tempo; candidatos novos na plataforma devem planejar-se para o limite superior dessa faixa.

A certificação NCP-GENL vale a pena?

NCP-GENL é uma credencial reconhecida no ecossistema NVIDIA e sinaliza conhecimento validado para empregadores, recrutadores e clientes. Se vale a pena o tempo e a taxa para você, depende do seu papel e objetivos — geralmente compensa mais para engenheiros de nuvem, arquitetos e consultores que trabalham com NVIDIA diariamente ou desejam mudar para funções que o fazem.

Qual é a pontuação de aprovação para NCP-GENL?

A pontuação de aprovação para NCP-GENL é 70%. O exame contém 60 questões e dura 2 h.

Quanto custa o exame NCP-GENL?

A taxa do exame NCP-GENL é $200 USD. As taxas são definidas por NVIDIA e podem variar por região; sempre confirme o preço atual na página oficial de certificação NVIDIA antes de agendar.

Por quanto tempo a certificação NCP-GENL é válida?

NVIDIA certifications are valid for 2 years. Renew by passing the current (or a higher-level) exam in the track before expiration.

Posso fazer NCP-GENL online?

Sim, as certificações NVIDIA são realizadas apenas online — não há centros de teste presenciais. O exame é executado em um navegador seguro supervisionado; você precisará de uma sala privada silenciosa, webcam, microfone, banda larga estável e um documento de identidade com foto emitido pelo governo.

Quantas questões há no exame prático NCP-GENL da CertLabPro?

A CertLabPro oferece 15 modos de estudo no banco de questões práticas para NCP-GENL. O modo de simulação de exame espelha o exame real: 60 questões em 2 h, com o mesmo limite de aprovação de 70%. O modo de navegação permite que você leia todas as perguntas e respostas estaticamente.

Certificações relacionadas

NCP-AAI

Professional

NCA-GENL

NVIDIA-Certified Associate: Generative AI LLMs

NVIDIA-Certified Associate: Generative AI Multimodal

NCA-GENM

NVIDIA-Certified Associate: AI Infrastructure and Operations

NCA-AIIO

NVIDIA

NCP-GENL

NVIDIA-Certified Professional: Generative AI LLMs

255 perguntas de prática

Última revisão: April 2026

Domínios do Exame

Model Optimization17%

GPU Acceleration and Optimization14%

Prompt Engineering13%

Fine-Tuning13%

Data Preparation9%

Model Deployment9%

Evaluation7%

Production Monitoring and Reliability7%

LLM Architecture6%

Safety, Ethics, and Compliance5%

ℹ️

Informações do exame

Inscrição, taxas, opções de entrega e políticas

→

Modo Exame

60 perguntas aleatórias
Cronômetro de 120 minutos
Pontuação no final (aprovação: 700/1000)
Simula o exame real

📘

Guia

Padrões cenário → solução
Agrupado por domínio do exame
Completo e gratuito na web e no celular
Pura referência — sem perguntas, sem pontuação

Modo Prática

Todas as 255 perguntas
Sem limite de tempo
Feedback instantâneo após cada resposta
Aprenda no seu próprio ritmo

📑

Modo Navegação

Todas as 255 perguntas em uma página
Respostas e explicações visíveis
Revisão rápida antes do exame
Role por tudo

🌿

Modo Zen

Uma pergunta por vez
Deslize ou use as setas
Opção de embaralhar disponível
Estudo relaxado tipo flashcard

⚡

Time Attack

Comece com 63 segundos
+10s por resposta correta
-5s por resposta incorreta
Bata seu recorde

❤️

Sobrevivência

Tempo ilimitado
Fim de jogo no primeiro erro
Construa sua sequência
Teste sua consistência

⚩

Modo Blitz

15 segundos por pergunta
Bônus por respostas rápidas
Multiplicador de sequência (2x, 3x...)
Teste de velocidade estilo arcade

🏃

Modo Sprint

Cronômetro ascendente
Acerte 10/25/50 seguidas
Erro reinicia sua sequência
Bata seu melhor tempo pessoal

🎓

Modo Flashcard

Apenas a pergunta, sem opções
Toque para revelar a resposta
Avalie: Sabia / Parcialmente / Não sabia
Perguntas fracas reaparecem antes

Modo Revisão Intensiva

Prioriza perguntas não vistas primeiro
Depois perguntas que você errou
Feedback instantâneo após cada resposta
Acompanhe sua cobertura total

🔥

Desafio de Sequência

Sem pressão de tempo
Acompanhe sua maior sequência
Erro reinicia para zero
Bata seu recorde pessoal

💪

Elo Fraco

Apenas perguntas que você errou
Acerte 3 vezes cada uma para dominar
Acompanhe o progresso de domínio
Elimine seus pontos fracos

Revisão SRS

Revisão diária com repetição espaçada
Perguntas agendadas em intervalos ideais
Avalie: De novo / Difícil / Bom / Fácil
Construa sua sequência de revisão diária

Notas de Estudo

Notas pessoais e links de recursos para sua jornada de estudo

NVIDIA-Certified Professional: Agentic AI

Calendário de Atividades

Filtrar por Certificação

Visão geral

Domínios do exame

Model Optimization17%
O domínio mais pesado, com 17%. Abrange quantization pós-treinamento (INT8, FP8, INT4/AWQ, GPTQ) versus treinamento com conscientização de quantization, otimização de KV-cache, poda e destilação de pesos, e construção de engine TensorRT-LLM com batching in-flight (contínuo). Espere perguntas sobre trade-offs que consideram latência, throughput, consumo de memória e degradação da precisão, e quando FP8 em Hopper/Blackwell supera INT8.
GPU Acceleration and Optimization14%
Com peso de 14%. Testa paralelismo de tensor/pipeline/sequência, sharding multi-GPU e multi-nó, conhecimento da topologia NVLink/NVSwitch e InfiniBand, CUDA Graphs, mixed precision e profiling de utilização de GPU com Nsight e DCGM. As perguntas investigam como escalar um modelo que excede a memória de uma única GPU e como diagnosticar gargalos ligados à comunicação versus ligados ao processamento.
Prompt Engineering13%
Com peso de 13%. Vai além dos fundamentos para prompting de produção: design few-shot e chain-of-thought, saída estruturada/restrita a JSON, versionamento de system-prompt, retrieval-augmented prompting e conscientização sobre prompt-injection. Espere cenários sobre como reduzir o custo e a latência de tokens, preservando a qualidade da resposta, e sobre decodificação guiada para saída vinculada a esquema.
Fine-Tuning13%
Com peso de 13%. Abrange fine-tuning completo versus métodos eficientes em parâmetros (LoRA, QLoRA, P-tuning, adapters), curadoria de dados SFT, alinhamento RLHF/DPO, workflows NeMo e NeMo Customizer, e mitigação de catastrophic-forgetting. As perguntas testam quando LoRA é suficiente, como mesclar adapters para inferência e como dimensionar rank, taxa de aprendizado e dataset para uma tarefa alvo.
Data Preparation9%
Com peso de 9%. Foca na curadoria de corpus de pré-treinamento/fine-tuning, deduplicação, filtragem de qualidade, escolhas de tokenização e vocabulário, formatação de dataset para NeMo, remoção de PII e descontaminação contra conjuntos de avaliação. Espere perguntas sobre a construção de pipelines de dados reproduzíveis e governados, e sobre o efeito da qualidade dos dados no comportamento do modelo downstream.
Model Deployment9%
Com peso de 9%. Abrange serving com microsserviços NVIDIA NIM, backends do Triton Inference Server, configuração de tempo de execução TensorRT-LLM, autoscaling, serving multi-modelo e concorrente, e endpoints compatíveis com OpenAI. Espere perguntas baseadas em cenários sobre a escolha entre NIM e um ensemble Triton personalizado, configurando batching dinâmico e atendendo aos SLOs de latência sob carga variável.
Evaluation7%
Com peso de 7%. Testa avaliação offline e online: suites de benchmark (MMLU, HellaSwag, etc.), métricas específicas da tarefa, LLM-as-a-judge, golden datasets, teste A/B e regression gates em CI. As perguntas enfatizam a escolha de métricas que reflitam os objetivos de negócio e a detecção de desvio de qualidade após uma alteração no modelo ou prompt.
Production Monitoring and Reliability7%
Com peso de 7%. Abrange observabilidade para serviços LLM: SLIs de latência/throughput/erro, utilização de GPU e KV-cache via DCGM e Prometheus, rastreamento de requisições, rollouts canary e blue-green, degradação graciosa e resposta a incidentes. Espere perguntas sobre limites de alerta, gatilhos de autoscaling e estratégia de rollback quando uma implantação regride.
LLM Architecture6%
Com peso de 6%. Abrange os internos de transformer: variantes de atenção (MHA, MQA, GQA, FlashAttention), positional encodings (RoPE, ALiBi), normalização, roteamento MoE, extensão do comprimento de contexto e as alavancas arquitetônicas por trás das famílias de modelos. As perguntas conectam as escolhas de arquitetura aos resultados de memória, throughput e qualidade.
Safety, Ethics, and Compliance5%
O domínio mais leve, com 5%, mas ainda examinável. Abrange guardrails (NeMo Guardrails), filtragem de conteúdo, defesa contra jailbreak e prompt-injection, avaliação de viés e toxicidade, governança de dados e conscientização regulatória. Espere perguntas sobre a aplicação de rails de entrada/saída em torno de um modelo implantado e sobre documentação de IA responsável.

Impacto na carreira

Cargos típicos

Engenheiro de LLM / Inferência
Engenheiro de Machine Learning (LLMs)
Engenheiro de MLOps / Plataforma de Modelos
Engenheiro de IA Aplicada
Arquiteto de Soluções GenAI

Faixa salarial (EUA, aproximado)

$135k–$180k–$245k USD anual

Fonte: levels.fyi 2025-2026, U.S. BLS OEWS maio de 2024, Glassdoor 2025. Os valores são aproximados; a compensação real depende da função, região e experiência.

Demanda de mercado

Pré-requisitos e caminho recomendado

Dificuldade e tempo de estudo

Histórico de versões do exame

NCP-GENL2025-01
Exame de nível profissional para Generative AI LLMs. Múltipla escolha baseada em cenários, aprovação de ~70% (700/1000), $200 USD, realizado online via Certiverse, validade de dois anos. Abrange otimização de modelo, aceleração de GPU, prompt engineering, fine-tuning, preparação de dados, implantação (NIM/Triton/TensorRT-LLM), avaliação, monitoramento de produção, arquitetura de LLM e segurança/ética/conformidade.

Perguntas frequentes

Qual é a dificuldade do exame NCP-GENL?

Quanto tempo devo estudar para NCP-GENL?

A certificação NCP-GENL vale a pena?

Qual é a pontuação de aprovação para NCP-GENL?

A pontuação de aprovação para NCP-GENL é 70%. O exame contém 60 questões e dura 2 h.

Quanto custa o exame NCP-GENL?

A taxa do exame NCP-GENL é $200 USD. As taxas são definidas por NVIDIA e podem variar por região; sempre confirme o preço atual na página oficial de certificação NVIDIA antes de agendar.

Por quanto tempo a certificação NCP-GENL é válida?

NVIDIA certifications are valid for 2 years. Renew by passing the current (or a higher-level) exam in the track before expiration.

Posso fazer NCP-GENL online?

Quantas questões há no exame prático NCP-GENL da CertLabPro?

Certificações relacionadas

NCP-AAI

Professional

NCA-GENL

NVIDIA-Certified Associate: Generative AI LLMs

NVIDIA-Certified Associate: Generative AI Multimodal

NCA-GENM

NVIDIA-Certified Associate: AI Infrastructure and Operations

NCA-AIIO