Microsoft Azure Data Scientist Associate
225 perguntas de prática
Última revisão: April 2026
Notas pessoais e links de recursos para sua jornada de estudo
Filtrar por Certificação
O DP-100 valida as habilidades diárias de um cientista de dados trabalhando no Azure: projetar soluções de ML, explorar e preparar dados, treinar e implantar modelos no Azure Machine Learning e — desde a atualização de 2024 — otimizar modelos de linguagem para aplicações de IA. O público são cientistas de dados e engenheiros de ML que escrevem Python usando o Azure ML SDK / CLI v2 e utilizam o Azure ML studio. O exame foca mais na implementação específica do Azure do que em estatística clássica ou teoria de algoritmos: espere 40–60 questões em 100 minutos, incluindo arrastar e soltar para completar código, itens de cenário e pelo menos um estudo de caso.
Cerca de 22%. Escolha de computação e armazenamento para cargas de trabalho de ML, workspaces do Azure ML, datastores e ativos de dados, ambientes e considerações de IA responsável no momento do design.
Cerca de 22%. Notebooks do Azure ML, AutoML para classificação / regressão / previsão / NLP / CV, Azure ML designer e integração básica do MLflow para rastreamento de experimentos.
O maior domínio de ML clássico, com 28%. Trabalhos de treinamento (jobs de script e comando), treinamento distribuído, jobs de varredura de hiperparâmetros, registro de modelo, endpoints online gerenciados, endpoints de lote e pipelines.
Novo domínio adicionado em 2024 com peso de 28%. Prompt flow, ajuste fino de modelos de base no Azure ML / Azure AI Foundry, avaliação de aplicações LLM, padrões RAG e controles de IA responsável para cenários generativos.
Serviços que você encontrará no exame e por que cada um importa.
Plataforma de ML gerenciada de ponta a ponta — workspaces, computação, datastores, ambientes, jobs, registries e endpoints de inferência gerenciados ao longo de todo o ciclo de vida.
Por que está no exame: O Azure ML é o serviço abrangente que engloba todos os domínios do DP-100 — espere questões sobre configuração de workspace, seleção de computação, versionamento de ativos e uso da CLI/SDK v2.
Workspace baseado na web para Azure ML — notebooks, rastreamento de experimentos, navegadores de ativos, gerenciamento de computação e implantação de modelos com um clique.
Por que está no exame: O Domínio 2 (Exploração de dados e execução de experimentos) testa o Studio como a interface para iniciar jobs, visualizar métricas de execução e comparar experimentos lado a lado.
Interface visual de arrastar e soltar para construir, treinar e implantar pipelines de ML sem escrever código, com módulos de dataset e transformação integrados.
Por que está no exame: O Domínio 1 apresenta o Designer como o caminho low-code para preparar dados e montar pipelines de treinamento — distinga-o dos workflows da SDK/CLI v2.
Treinamento automatizado que varre algoritmos, featurização e hiperparâmetros em tarefas de classificação, regressão, previsão, NLP e visão.
Por que está no exame: O Domínio 3 (Treinamento e implantação de modelos) testa o AutoML para modelos de linha de base, seleção de modelos em escala e identificação da melhor execução para registro.
Orquestração multi-etapa versionada para preparação de dados, treinamento, avaliação e implantação — declarada via jobs YAML ou Python SDK v2.
Por que está no exame: Cenários de reprodutibilidade e reusabilidade nos Domínios 2 e 3 nomeiam Pipelines como a resposta canônica em vez de scripts ad-hoc ou notebooks.
Registro com escopo de workspace para modelos versionados com estágios, tags e linhagem assinada de volta ao job de treinamento e versão do dataset.
Por que está no exame: Cenários de promoção para produção no Domínio 3 testam o Model Registry como a entrega auditável entre o treinamento e a implantação de inferência.
Endpoints gerenciados online (baixa latência em tempo real) e batch para inferência hospedada, com divisão de tráfego, autoescalabilidade e identidade gerenciada.
Por que está no exame: O Domínio 3 frequentemente questiona tradeoffs entre online e batch e lançamentos blue/green com divisão de tráfego — os endpoints gerenciados são o primitivo nomeado.
Workspace unificado para construir aplicações de IA generativa — catálogo de modelos, fine-tuning, fluxos de avaliação, orquestração de prompts e integração de segurança de conteúdo.
Por que está no exame: O Domínio 4 (Otimização de modelos de linguagem para aplicações de IA) é ancorado no AI Foundry como a plataforma para seleção de modelos de fundação, fine-tuning e avaliação.
Plataforma Apache Spark + Delta Lake gerenciada com rastreamento MLflow, treinamento distribuído e forte interoperabilidade com Azure ML para preparação de dados e modelagem em larga escala.
Por que está no exame: Cenários de Domínio 1 com grandes volumes de dados preferem Databricks para engenharia de features distribuída e transformações PySpark fora da computação do Azure ML.
Plataforma de análise unificada que combina pools SQL dedicados/serverless, pools Spark e pipelines para preparação de dados em escala de data warehouse alimentando o Azure ML.
Por que está no exame: Questões do Domínio 1 sobre fontes de dados corporativos para treinamento nomeiam o Synapse como o conector de origem do lado do data warehouse para datastores do Azure ML.
Camada de armazenamento de blobs com namespace hierárquico otimizada para cargas de trabalho de análise — o armazenamento de apoio padrão para datastores e ativos de treinamento do Azure ML.
Por que está no exame: Todo cenário de preparação de dados do DP-100 assume o ADLS Gen2 como o substrato de dados — registro de datastore, ACLs e políticas de ciclo de vida aparecem no Domínio 1.
Acesso gerenciado a modelos de fundação OpenAI (GPT-4o, GPT-4.1, o-series, modelos de embedding) com fine-tuning, filtros de conteúdo e autenticação Entra ID.
Por que está no exame: Cenários de fine-tuning, embedding e prompt-engineering do Domínio 4 para aplicações de modelos de linguagem são ancorados no Azure OpenAI Service.
Servidor de rastreamento MLflow nativo dentro de cada workspace do Azure ML — registra parâmetros, métricas, artefatos e modelos com o MLflow SDK aberto.
Por que está no exame: Questões de rastreamento de experimentos do Domínio 2 nomeiam MLflow como a API canônica; espere distratores comparando autolog do MLflow com captura manual de saída de job.
Clusters de computação gerenciados (CPU/GPU), instâncias de computação e opções de treinamento serverless com autoescalabilidade, precificação de baixa prioridade e camadas spot.
Por que está no exame: Cenários de treinamento do Domínio 3 testam a seleção CPU-vs-GPU, dimensionamento de cluster para treinamento distribuído e planejamento de cota para varreduras de hiperparâmetros.
Criação visual + code-first de workflows de LLM — templates de prompt, chamadas de ferramenta encadeadas, fluxos de avaliação e classificação de execuções em lote contra conjuntos de teste.
Por que está no exame: Cenários de RAG, prompt-engineering e avaliação do Domínio 4 são testados através do Prompt Flow como a superfície de autoria de nível de produção.
Computação serverless orientada a eventos para inferência leve em tempo real, pós-processamento de saída de modelo e integração de chamadas do Azure ML em workflows de negócio.
Por que está no exame: Questões de padrões de implantação do Domínio 3 distinguem endpoints online gerenciados de inferência personalizada baseada em Functions por razões de cold-start, tamanho de payload ou custo.
Plataforma de identidade que fornece autenticação de usuário/service-principal, identidades gerenciadas, roles RBAC e Acesso Condicional para cada recurso do Azure ML.
Por que está no exame: Cenários de configuração de workspace do Domínio 1 e controle de acesso de implantação do Domínio 3 nomeiam identidades gerenciadas do Entra ID como a forma nativa do AAD de autorizar computação e endpoints.
Armazenamento gerenciado de segredos, chaves e certificados para strings de conexão, chaves de API de modelo e chaves gerenciadas pelo cliente protegendo dados de treinamento e artefatos.
Por que está no exame: A criptografia de dados do workspace do Azure ML com chaves gerenciadas pelo cliente e a recuperação de segredos de jobs de treinamento nomeiam o Key Vault como a resposta no Domínio 1.
Métricas, logs, alertas e cobertura de Application Insights para endpoints do Azure ML, jobs de treinamento e sinais de data drift via workspaces do Log Analytics.
Por que está no exame: Cenários de monitoramento de produção do Domínio 3 testam o Azure Monitor + Log Analytics para alertas de latência/erro de endpoints e para apresentar detecções de model-drift às equipes de operações.
Governança de dados unificada para escanear datastores, classificar dados sensíveis, mapear linhagem e impor políticas de acesso em todo o ambiente analítico.
Por que está no exame: Questões de IA Responsável e governança de dados nos Domínios 1 e 4 referenciam o Purview para linhagem de dados de treinamento, classificação de PII e portões de liberação de modelo cientes da linhagem.
$115k–$165k–$230k USD anual
A faixa cobre cientistas de dados de nível médio a sênior baseados nos EUA, onde a proficiência em Azure ML é exigida. Cientistas aplicados em empresas FAANG / unicórnios frequentemente superam $300 mil TC. A certificação é um sinal de triagem; experiência comprovada em modelagem e presença em publicações / kaggle / código aberto impulsionam o limite superior.
Fonte: funções de cientista de dados / engenheiro de ML no levels.fyi 2025, U.S. BLS OEWS maio de 2024 (15-2051 cientistas de dados, 15-2099 cientistas de ML), Glassdoor 2025. Os valores são aproximados; a compensação real depende da função, região e experiência.
O DP-100 manteve uma demanda constante à medida que as empresas operacionalizam ML no Azure ML e, cada vez mais, no Azure AI Foundry. Recrutadores o consideram o ponto de prova canônico do Azure ML — mais útil para cientistas de dados que precisam demonstrar que podem ir além de um notebook para endpoints e pipelines gerenciados. O domínio de otimização de LLM de 2024 também tornou o DP-100 mais atraente para engenheiros de GenAI. Ele combina naturalmente com o AI-102 para engenheiros que constroem aplicações GenAI de produção e com o DP-203 / DP-700 para profissionais de ML com foco em engenharia de dados.
Não há pré-requisitos formais, mas o DP-100 assume habilidades de ciência de dados em nível de praticante. O esboço da Microsoft espera fluência em Python, o stack scikit-learn / pandas / NumPy e o fluxo de trabalho central de ML (dividir, treinar, avaliar, implantar). O DP-900 é uma rampa de acesso conceitual útil para candidatos novos em serviços de dados do Azure, mas não é obrigatório.
O caminho oficial do Microsoft Learn cobre todos os quatro domínios em aproximadamente 30–40 horas, focado no Azure ML SDK / CLI v2 e prompt flow. O tempo de prática é essencialmente exigido: uma assinatura pessoal do Azure com um pequeno workspace do Azure ML, mais de 10 horas executando trabalhos de treinamento reais, implantações de modelos e execuções de prompt-flow. O domínio de otimização de LLM de 2024 é pouco coberto por material de terceiros mais antigo, então os candidatos devem confiar nos módulos do Microsoft Learn para essa área.
O DP-100 está no nível Associado e é geralmente considerado de dificuldade moderada — mais fácil que AZ-204 / AI-102 para cientistas de dados experientes, mais difícil para engenheiros novos em ML. Planeje de 60–100 horas de estudo ao longo de 6–10 semanas com experiência prévia em ciência de dados; consideravelmente mais se ML com Python for novo para você. O exame dura cerca de 100 minutos com 40–60 questões em formatos de múltipla escolha, múltiplas respostas, arrastar e soltar (incluindo completar código), hot-area e estudo de caso.
O obstáculo mais comum são os detalhes do Azure ML SDK / CLI v2 — a recente migração da Microsoft do SDK v1 para o v2 quebrou muitos guias de estudo de terceiros, então materiais mais antigos podem mostrar YAML e formatos de comando desatualizados. O novo domínio de otimização de LLM (prompt flow, ajuste fino, avaliação) tem sua própria curva de aprendizado e tende a surpreender candidatos que consideravam o DP-100 um exame de ML clássico.
Grande atualização adicionando o domínio de otimização de LLM (28% de peso), modernizando o material de treinamento e implantação para Azure ML SDK / CLI v2, e integrando conceitos do Azure AI Foundry. A Microsoft atualiza o DP-100 aproximadamente a cada 12–18 meses sem alterar o código do exame.
Migração do Azure ML SDK v1 para a estrutura SDK / CLI v2, aposentadoria de questões focadas no Azure ML designer e adição de cobertura de integração do MLflow.
Lançamento inicial (GA), substituindo o DP-100 aposentado (código legado). O esboço original focava no Azure ML designer, AutoML e SDK v1.
DP-100 (Microsoft Azure Data Scientist Associate) é um exame de nível Associate um exame de dificuldade moderada que exige experiência prática e um sólido entendimento das melhores práticas. A maioria dos candidatos precisa de 80 a 150 horas de estudo distribuídas em 6 a 12 semanas para exames de nível associado. A maioria dos candidatos que pontuam consistentemente acima do limite de aprovação em exames práticos é aprovada na primeira tentativa.
A maioria dos candidatos precisa de 80 a 150 horas de estudo distribuídas em 6 a 12 semanas para exames de nível associado. O tempo para aprovação varia amplamente de acordo com a experiência prévia. Engenheiros com experiência prática de produção na tecnologia subjacente geralmente precisam de menos tempo; candidatos novos na plataforma devem planejar-se para o limite superior dessa faixa.
DP-100 é uma credencial reconhecida no ecossistema Azure e sinaliza conhecimento validado para empregadores, recrutadores e clientes. Se vale a pena o tempo e a taxa para você, depende do seu papel e objetivos — geralmente compensa mais para engenheiros de nuvem, arquitetos e consultores que trabalham com Azure diariamente ou desejam mudar para funções que o fazem.
A pontuação de aprovação para DP-100 é 700 / 1000. O exame contém 50 questões e dura 1 h 40 min.
A taxa do exame DP-100 é $165 USD. As taxas são definidas por Azure e podem variar por região; sempre confirme o preço atual na página oficial de certificação Azure antes de agendar.
As certificações Microsoft baseadas em função expiram após 1 ano, mas podem ser renovadas gratuitamente por meio de uma avaliação online não supervisionada no Microsoft Learn, a partir de 6 meses antes do vencimento.
Sim. Você pode fazer o exame online (supervisionado através do navegador seguro do provedor, disponível 24 horas por dia, 7 dias por semana na maioria das regiões) ou em um centro de testes Pearson VUE presencial durante o horário comercial. Ambos os formatos usam as mesmas perguntas, limite de tempo e pontuação de aprovação.
A CertLabPro oferece 15 modos de estudo no banco de questões práticas para DP-100. O modo de simulação de exame espelha o exame real: 50 questões em 1 h 40 min, com o mesmo limite de aprovação de 700 / 1000. O modo de navegação permite que você leia todas as perguntas e respostas estaticamente.