Microsoft Azure Data Scientist Associate
225 questions de pratique
Dernière révision : April 2026
Notes personnelles et liens de ressources pour votre parcours d'étude
Filtrer par Certification
Le DP-100 valide les compétences quotidiennes d'un data scientist travaillant sur Azure : concevoir des solutions ML, explorer et préparer des données, entraîner et déployer des modèles dans Azure Machine Learning, et — depuis la mise à jour de 2024 — optimiser les modèles de langage pour les applications d'IA. L'audience est composée de data scientists et d'ingénieurs ML en exercice qui écrivent du Python avec le SDK Azure ML / CLI v2 et utilisent Azure ML studio. L'examen met davantage l'accent sur l'implémentation spécifique à Azure que sur les statistiques classiques ou la théorie des algorithmes : attendez-vous à 40–60 questions en 100 minutes, y compris des glisser-déposer de complétion de code, des éléments de scénario et au moins une étude de cas.
Environ 22 %. Choix des ressources de calcul et de stockage pour les charges de travail ML, workspaces Azure ML, datastores et assets de données, environnements, et considérations d'IA responsable lors de la conception.
Environ 22 %. Notebooks Azure ML, AutoML pour la classification / régression / prévision / NLP / CV, Azure ML designer, et intégration MLflow de base pour le suivi des expériences.
Le plus grand domaine ML classique, à 28 %. Jobs d'entraînement (jobs de script et de commande), entraînement distribué, jobs de balayage d'hyperparamètres, enregistrement de modèles, endpoints en ligne gérés, endpoints par lots et pipelines.
Nouveau domaine ajouté en 2024 avec un poids de 28 %. Prompt flow, fine-tuning de modèles de fondation dans Azure ML / Azure AI Foundry, évaluation des applications LLM, patterns RAG, et contrôles d'IA responsable pour les scénarios génératifs.
Les services que vous rencontrerez à l'examen et pourquoi chacun compte.
Plateforme ML entièrement gérée de bout en bout — espaces de travail, calcul, magasins de données, environnements, jobs, registres et points de terminaison d'inférence gérés sur l'ensemble du cycle de vie.
Pourquoi il est à l'examen : Azure ML est le service fédérateur couvrant tous les domaines du DP-100 — attendez-vous à des questions sur la configuration de l'espace de travail, la sélection du calcul, le versionnement des actifs et l'utilisation des CLI/SDK v2.
Espace de travail web pour Azure ML — notebooks, suivi des expériences, navigateurs d'actifs, gestion du calcul et déploiement de modèles en un clic.
Pourquoi il est à l'examen : Le Domaine 2 (Exploration des données et exécution d'expériences) évalue Studio comme l'interface pour lancer des jobs, visualiser les métriques d'exécution et comparer les expériences côte à côte.
Interface visuelle par glisser-déposer pour construire, entraîner et déployer des pipelines ML sans écrire de code, avec des modules de jeu de données et de transformation intégrés.
Pourquoi il est à l'examen : Le Domaine 1 présente Designer comme la voie low-code pour préparer les données et assembler les pipelines d'entraînement — le distinguer des workflows SDK/CLI v2.
Entraînement automatisé qui explore les algorithmes, la caractérisation et les hyperparamètres pour les tâches de classification, régression, prévision, NLP et vision.
Pourquoi il est à l'examen : Le Domaine 3 (Entraînement et déploiement de modèles) évalue AutoML pour les modèles de référence, la sélection de modèles à l'échelle et la présentation de la meilleure exécution pour l'enregistrement.
Orchestration multi-étapes versionnée pour la préparation des données, l'entraînement, l'évaluation et le déploiement — déclarée via des jobs YAML ou le SDK Python v2.
Pourquoi il est à l'examen : Les scénarios de reproductibilité et de réutilisabilité dans les Domaines 2 et 3 désignent les Pipelines comme la réponse canonique par rapport aux scripts ad hoc ou aux notebooks.
Registre de modèles versionnés à l'échelle de l'espace de travail, avec des étapes, des tags et une traçabilité signée remontant au job d'entraînement et à la version du jeu de données.
Pourquoi il est à l'examen : Les scénarios de promotion à la production du Domaine 3 évaluent le Model Registry comme le point de transfert auditable entre l'entraînement et le déploiement d'inférence.
Points de terminaison en ligne (temps réel à faible latence) et par lots gérés pour l'inférence hébergée, avec répartition du trafic, autoscaling et identité gérée.
Pourquoi il est à l'examen : Le Domaine 3 pose fréquemment des questions sur les compromis en ligne vs par lots et les déploiements blue/green avec répartition du trafic — les points de terminaison gérés sont la primitive nommée.
Espace de travail unifié pour la création d'applications d'IA générative — catalogue de modèles, fine-tuning, flux d'évaluation, orchestration de prompts et intégration de la sécurité du contenu.
Pourquoi il est à l'examen : Le Domaine 4 (Optimisation des modèles linguistiques pour les applications IA) est ancré sur AI Foundry comme plateforme pour la sélection de modèles de fondation, le fine-tuning et l'évaluation.
Plateforme Apache Spark + Delta Lake gérée avec suivi MLflow, entraînement distribué et interopérabilité étroite avec Azure ML pour la préparation et la modélisation de données à grande échelle.
Pourquoi il est à l'examen : Les scénarios de données volumineuses du Domaine 1 privilégient Databricks pour l'ingénierie de fonctionnalités distribuée et les transformations PySpark en dehors du calcul Azure ML.
Plateforme analytique unifiée combinant des pools SQL dédiés/serverless, des pools Spark et des pipelines pour la préparation de données à l'échelle de l'entrepôt alimentant Azure ML.
Pourquoi il est à l'examen : Les questions du Domaine 1 sur les sources de données d'entreprise pour l'entraînement désignent Synapse comme le connecteur source côté entrepôt pour les magasins de données Azure ML.
Niveau de stockage d'objets blob à namespace hiérarchique optimisé pour les charges de travail analytiques — le magasin de sauvegarde par défaut pour les magasins de données et les actifs d'entraînement Azure ML.
Pourquoi il est à l'examen : Chaque scénario de préparation de données du DP-100 suppose ADLS Gen2 comme substrat de données — l'enregistrement des magasins de données, les ACL et les politiques de cycle de vie apparaissent tous dans le Domaine 1.
Accès géré aux modèles de fondation OpenAI (GPT-4o, GPT-4.1, séries o, modèles d'embedding) avec fine-tuning, filtres de contenu et authentification Entra-ID.
Pourquoi il est à l'examen : Les scénarios de fine-tuning, d'embedding et d'ingénierie de prompts du Domaine 4 pour les applications de modèles linguistiques sont ancrés sur Azure OpenAI Service.
Serveur de suivi MLflow natif dans chaque espace de travail Azure ML — enregistrez les paramètres, métriques, artefacts et modèles avec le SDK MLflow open source.
Pourquoi il est à l'examen : Les questions de suivi d'expériences du Domaine 2 désignent MLflow comme l'API canonique ; attendez-vous à des distracteurs comparant l'autolog MLflow à la capture manuelle des sorties de job.
Clusters de calcul gérés (CPU/GPU), instances de calcul et options d'entraînement serverless avec autoscaling, tarification à faible priorité et niveaux spot.
Pourquoi il est à l'examen : Les scénarios d'entraînement du Domaine 3 testent la sélection CPU vs GPU, le dimensionnement des clusters pour l'entraînement distribué et la planification des quotas pour les balayages d'hyperparamètres.
Création visuelle + code-first de workflows LLM — modèles de prompts, appels d'outils chaînés, flux d'évaluation et notation d'exécutions par lots par rapport à des jeux de tests.
Pourquoi il est à l'examen : Les scénarios RAG, d'ingénierie de prompts et d'évaluation du Domaine 4 sont testés via Prompt Flow comme surface de création de qualité production.
Calcul serverless événementiel pour l'inférence légère en temps réel, le post-traitement des sorties de modèle et l'intégration des appels Azure ML dans les workflows métier.
Pourquoi il est à l'examen : Les questions de modèles de déploiement du Domaine 3 distinguent les points de terminaison en ligne gérés de l'inférence personnalisée basée sur Functions pour des raisons de démarrage à froid, de taille de payload ou de coût.
Plateforme d'identité offrant l'authentification des utilisateurs/principaux de service, les identités gérées, les rôles RBAC et l'accès conditionnel pour chaque ressource Azure ML.
Pourquoi il est à l'examen : La configuration de l'espace de travail du Domaine 1 et les scénarios de contrôle d'accès au déploiement du Domaine 3 désignent les identités gérées Entra ID comme le moyen natif AAD d'autoriser le calcul et les points de terminaison.
Magasin géré de secrets, clés et certificats pour les chaînes de connexion, les clés API de modèle et les clés gérées par le client protégeant les données d'entraînement et les artefacts.
Pourquoi il est à l'examen : Le chiffrement des données de l'espace de travail Azure ML avec des clés gérées par le client et la récupération des secrets des jobs d'entraînement désignent tous deux Key Vault comme la réponse dans le Domaine 1.
Couverture des métriques, logs, alertes et Application Insights pour les points de terminaison Azure ML, les jobs d'entraînement et les signaux de dérive de données via les espaces de travail Log Analytics.
Pourquoi il est à l'examen : Les scénarios de surveillance de la production du Domaine 3 évaluent Azure Monitor + Log Analytics pour les alertes de latence/erreur des points de terminaison et la remontée des détections de dérive de modèle aux équipes ops.
Gouvernance unifiée des données pour l'analyse des magasins de données, la classification des données sensibles, le mappage de la traçabilité et l'application des politiques d'accès sur l'ensemble du patrimoine analytique.
Pourquoi il est à l'examen : Les questions d'IA responsable et de gouvernance des données dans les Domaines 1 et 4 font référence à Purview pour la traçabilité des données d'entraînement, la classification des PII et les portes de publication de modèles conscientes de la traçabilité.
$115k–$165k–$230k USD annuel
Cette fourchette couvre les data scientists de niveau intermédiaire à senior basés aux États-Unis pour lesquels la maîtrise d'Azure ML est requise. Les scientifiques appliqués des FAANG / licornes dépassent souvent les 300 000 $ de rémunération totale. La certification est un signal de sélection ; une expérience avérée en modélisation et une présence dans des publications / Kaggle / open source stimulent la tranche haute.
Source : Rôles de data scientist / ingénieur ML selon levels.fyi 2025, U.S. BLS OEWS May 2024 (15-2051 data scientists, 15-2099 ML scientists), Glassdoor 2025. Les chiffres sont approximatifs ; la rémunération réelle dépend du rôle, de la région et de l'expérience.
Le DP-100 a maintenu une demande constante à mesure que les entreprises opérationnalisent le ML sur Azure ML et de plus en plus sur Azure AI Foundry. Les recruteurs le considèrent comme la preuve canonique de maîtrise d'Azure ML — il est particulièrement utile pour les data scientists qui doivent démontrer leur capacité à livrer des solutions au-delà d'un simple notebook, vers des endpoints gérés et des pipelines. Le domaine d'optimisation des LLM ajouté en 2024 a également rendu le DP-100 plus attractif pour les ingénieurs GenAI. Il s'associe naturellement à l'AI-102 pour les ingénieurs qui développent des applications GenAI en production, et aux DP-203 / DP-700 pour les praticiens ML ayant une forte orientation ingénierie des données.
Il n'y a pas de prérequis formels, mais le DP-100 suppose des compétences de data science de niveau praticien. Le programme de Microsoft attend une maîtrise de Python, de la pile scikit-learn / pandas / NumPy, et du flux de travail ML essentiel (division, entraînement, évaluation, déploiement). Le DP-900 est un point d'entrée conceptuel utile pour les candidats novices aux services de données Azure, mais n'est pas obligatoire.
Le parcours officiel Microsoft Learn couvre les quatre domaines en environ 30 à 40 heures, en se concentrant sur Azure ML SDK / CLI v2 et prompt flow. Une expérience pratique est essentielle : un abonnement Azure personnel avec un petit workspace Azure ML, plus 10+ heures d'exécution de véritables jobs d'entraînement, de déploiements de modèles et d'exécutions de prompt flow. Le domaine d'optimisation LLM de 2024 est peu couvert par les anciens supports tiers, les candidats doivent donc se fier aux modules Microsoft Learn pour ce domaine.
Le DP-100 se situe dans le niveau Associate et est généralement considéré comme moyennement difficile — plus facile que l'AZ-204 / AI-102 pour les data scientists expérimentés, plus difficile pour les ingénieurs débutant en ML. Prévoyez 60 à 100 heures d'étude sur 6 à 10 semaines avec une expérience préalable en science des données ; beaucoup plus si le ML avec Python est nouveau pour vous. L'examen dure environ 100 minutes avec 40 à 60 questions sous des formats à choix multiples, à réponses multiples, glisser-déposer (y compris la complétion de code), zones réactives et études de cas.
Le principal écueil est la spécificité du SDK Azure ML / CLI v2 — la migration récente de Microsoft du SDK v1 vers v2 a rendu obsolètes de nombreux guides d'étude tiers, de sorte que les anciens supports peuvent présenter des YAML et des formes de commande dépassés. Le nouveau domaine d'optimisation des LLM (prompt flow, fine-tuning, évaluation) a sa propre courbe d'apprentissage et a tendance à surprendre les candidats qui considéraient le DP-100 comme un examen de ML classique.
Mise à jour majeure ajoutant le domaine d'optimisation des LLM (poids de 28 %), modernisant le matériel des jobs d'entraînement et de déploiement vers Azure ML SDK / CLI v2, et intégrant les concepts d'Azure AI Foundry. Microsoft actualise le DP-100 environ tous les 12 à 18 mois sans modifier le code de l'examen.
Migration du cadrage du SDK Azure ML v1 vers le SDK / CLI v2, retrait des questions fortement axées sur Azure ML designer, et ajout de la couverture de l'intégration MLflow.
Disponibilité générale initiale, remplaçant le DP-100 retiré (code hérité). Le programme initial était axé sur Azure ML designer, AutoML et le SDK v1.
DP-100 (Microsoft Azure Data Scientist Associate) est un examen de niveau Associate un examen de difficulté modérée exigeant une expérience pratique concrète ainsi qu'une solide compréhension des meilleures pratiques. La plupart des candidats ont besoin de 80 à 150 heures d'étude réparties sur 6 à 12 semaines pour les examens de niveau associé. La plupart des candidats qui obtiennent des scores constamment supérieurs au seuil de réussite lors des examens pratiques réussissent dès leur première tentative.
La plupart des candidats ont besoin de 80 à 150 heures d'étude réparties sur 6 à 12 semaines pour les examens de niveau associé. Le temps nécessaire pour réussir varie considérablement en fonction de l'expérience antérieure. Les ingénieurs ayant une expérience pratique en production avec la technologie sous-jacente en ont généralement besoin de moins ; les candidats novices sur la plateforme devraient viser la limite supérieure de cette fourchette.
DP-100 est une certification reconnue dans l'écosystème Azure et signale des connaissances validées aux employeurs, recruteurs et clients. Sa valeur en termes de temps et de coût dépend de votre rôle et de vos objectifs — elle est la plus avantageuse pour les ingénieurs cloud, architectes et consultants qui travaillent quotidiennement avec Azure ou souhaitent évoluer vers des rôles similaires.
Le score de réussite pour le DP-100 est de 700 / 1000. L'examen contient 50 questions et dure 1 h 40 min.
Les frais d'examen DP-100 sont de $165 USD. Les frais sont fixés par Azure et peuvent varier selon la région ; confirmez toujours le prix actuel sur la page de certification officielle de Azure avant de réserver.
Les certifications Microsoft basées sur les rôles expirent après 1 an mais peuvent être renouvelées gratuitement via une évaluation en ligne non supervisée sur Microsoft Learn, à partir de 6 mois avant l'expiration.
Oui. Vous pouvez passer l'examen en ligne (supervisé via le navigateur sécurisé du fournisseur, disponible 24h/24 et 7j/7 dans la plupart des régions) ou dans un centre de test Pearson VUE en personne pendant les heures ouvrables. Les deux formats utilisent les mêmes questions, la même limite de temps et le même score de réussite.
CertLabPro propose 15 modes d'étude à travers la banque de questions pratiques pour le DP-100. Le mode de simulation d'examen reproduit l'examen réel : 50 questions en 1 h 40 min, avec le même seuil de réussite de 700 / 1000. Le mode navigation vous permet de lire chaque Q&A de manière statique.