Microsoft Azure Data Scientist Associate
225 preguntas de práctica
Última revisión: April 2026
Notas personales y enlaces de recursos para tu camino de estudio
Filtrar por Certificación
DP-100 valida las habilidades diarias de un científico de datos que trabaja con Azure: diseñar soluciones de ML, explorar y preparar datos, entrenar e implementar modelos en Azure Machine Learning y, desde la actualización de 2024, optimizar modelos de lenguaje para aplicaciones de IA. La audiencia son científicos de datos e ingenieros de ML en activo que programan en Python con el SDK / CLI v2 de Azure ML y usan Azure ML studio. El examen se centra más en la implementación específica de Azure que en la estadística clásica o la teoría de algoritmos: espere 40-60 preguntas en 100 minutos, incluyendo arrastrar y soltar para completar código, elementos de escenario y al menos un estudio de caso.
Aproximadamente 22%. Elección de cómputo y almacenamiento para cargas de trabajo de ML, espacios de trabajo de Azure ML, almacenes de datos y recursos de datos, entornos y consideraciones de IA responsable en la fase de diseño.
Aproximadamente 22%. Cuadernos de Azure ML, AutoML para clasificación / regresión / pronóstico / NLP / CV, diseñador de Azure ML e integración básica de MLflow para el seguimiento de experimentos.
El dominio de ML clásico más grande, con un 28%. Trabajos de entrenamiento (jobs de script y comando), entrenamiento distribuido, trabajos de barrido de hiperparámetros, registro de modelos, puntos de conexión en línea administrados, puntos de conexión por lotes y pipelines.
Nuevo dominio añadido en 2024 con un peso del 28%. Flujo de prompts, ajuste fino de modelos fundacionales en Azure ML / Azure AI Foundry, evaluación de aplicaciones LLM, patrones RAG y controles de IA responsable para escenarios generativos.
Servicios que encontrarás en el examen y por qué cada uno importa.
Plataforma ML gestionada de extremo a extremo: espacios de trabajo, cómputo, almacenes de datos, entornos, trabajos, registros y puntos de conexión de inferencia gestionados a lo largo de todo el ciclo de vida.
Por qué está en el examen: Azure ML es el servicio paraguas que abarca cada dominio del DP-100; espere preguntas sobre la configuración del espacio de trabajo, la selección de cómputo, el versionado de activos y el uso de la CLI/SDK v2.
Espacio de trabajo basado en web para Azure ML: notebooks, seguimiento de experimentos, exploradores de activos, gestión de cómputo y despliegue de modelos con un clic.
Por qué está en el examen: El Dominio 2 (Explorar datos y ejecutar experimentos) evalúa Studio como la interfaz para iniciar trabajos, ver métricas de ejecución y comparar experimentos lado a lado.
Interfaz visual de arrastrar y soltar para construir, entrenar y desplegar pipelines de ML sin escribir código, con módulos de conjuntos de datos y transformación incorporados.
Por qué está en el examen: El Dominio 1 presenta Designer como la ruta de bajo código para preparar datos y ensamblar pipelines de entrenamiento; distíngalo de los flujos de trabajo con SDK/CLI v2.
Entrenamiento automatizado que explora algoritmos, ingeniería de características e hiperparámetros en tareas de clasificación, regresión, previsión, NLP y visión.
Por qué está en el examen: El Dominio 3 (Entrenar e implementar modelos) evalúa AutoML para modelos base, selección de modelos a escala y para identificar la mejor ejecución para el registro.
Orquestación versionada de varios pasos para preparación de datos, entrenamiento, evaluación y despliegue, declarada a través de trabajos YAML o el SDK de Python v2.
Por qué está en el examen: Los escenarios de reproducibilidad y reusabilidad en los Dominios 2 y 3 identifican a Pipelines como la respuesta canónica sobre scripts o notebooks ad-hoc.
Registro con ámbito de espacio de trabajo de modelos versionados con etapas, etiquetas y linaje firmado que se remonta al trabajo de entrenamiento y la versión del conjunto de datos.
Por qué está en el examen: Los escenarios de promoción a producción del Dominio 3 evalúan el Registro de Modelos como la entrega auditable entre el entrenamiento y el despliegue de inferencia.
Puntos de conexión gestionados en línea (tiempo real de baja latencia) y por lotes para inferencia alojada, con división de tráfico, autoescalado e identidad gestionada.
Por qué está en el examen: El Dominio 3 pregunta frecuentemente sobre las compensaciones entre inferencia en línea y por lotes, y despliegues con división de tráfico azul/verde; los puntos de conexión gestionados son la primitiva nombrada.
Espacio de trabajo unificado para construir aplicaciones de IA generativa: catálogo de modelos, ajuste fino, flujos de evaluación, orquestación de prompts e integración de seguridad de contenido.
Por qué está en el examen: El Dominio 4 (Optimizar modelos de lenguaje para aplicaciones de IA) se basa en AI Foundry como la plataforma para la selección, ajuste fino y evaluación de modelos fundacionales.
Plataforma gestionada de Apache Spark + Delta Lake con seguimiento de MLflow, entrenamiento distribuido e interoperabilidad estrecha con Azure ML para preparación de datos y modelado a gran escala.
Por qué está en el examen: Los escenarios de datos grandes del Dominio 1 prefieren Databricks para la ingeniería de características distribuida y las transformaciones de PySpark fuera del cómputo de Azure ML.
Plataforma de análisis unificada que combina pools SQL dedicados/sin servidor, pools de Spark y pipelines para la preparación de datos a escala de almacén que alimentan Azure ML.
Por qué está en el examen: Las preguntas del Dominio 1 sobre fuentes de datos empresariales para el entrenamiento nombran a Synapse como el conector de origen del lado del almacén para los almacenes de datos de Azure ML.
Nivel de almacenamiento de blobs con espacio de nombres jerárquico optimizado para cargas de trabajo analíticas; es el almacén de respaldo predeterminado para los almacenes de datos y activos de entrenamiento de Azure ML.
Por qué está en el examen: Todo escenario de preparación de datos del DP-100 asume ADLS Gen2 como sustrato de datos; el registro de almacenes de datos, las ACL y las políticas de ciclo de vida aparecen en el Dominio 1.
Acceso gestionado a modelos fundacionales de OpenAI (GPT-4o, GPT-4.1, series-o, modelos de embeddings) con ajuste fino, filtros de contenido y autenticación Entra-ID.
Por qué está en el examen: Los escenarios de ajuste fino, embeddings e ingeniería de prompts del Dominio 4 para aplicaciones de modelos de lenguaje se basan en Azure OpenAI Service.
Servidor de seguimiento MLflow nativo dentro de cada espacio de trabajo de Azure ML: registre parámetros, métricas, artefactos y modelos con el SDK de MLflow de código abierto.
Por qué está en el examen: Las preguntas de seguimiento de experimentos del Dominio 2 nombran a MLflow como la API canónica; espere distractores que comparen el autolog de MLflow con la captura manual de salida de trabajos.
Clústeres de cómputo gestionados (CPU/GPU), instancias de cómputo y opciones de entrenamiento sin servidor con autoescalado, precios de baja prioridad y niveles de spot.
Por qué está en el examen: Los escenarios de entrenamiento del Dominio 3 evalúan la selección de CPU frente a GPU, el dimensionamiento de clústeres para entrenamiento distribuido y la planificación de cuotas para barridos de hiperparámetros.
Autoría visual + code-first de flujos de trabajo LLM: plantillas de prompts, llamadas de herramientas encadenadas, flujos de evaluación y calificación de ejecuciones por lotes contra conjuntos de prueba.
Por qué está en el examen: Los escenarios de RAG, ingeniería de prompts y evaluación del Dominio 4 se evalúan a través de Prompt Flow como la superficie de autoría de grado de producción.
Cómputo sin servidor dirigido por eventos para inferencia ligera en tiempo real, post-procesamiento de salida de modelos y para integrar llamadas de Azure ML en flujos de trabajo empresariales.
Por qué está en el examen: Las preguntas de patrones de despliegue del Dominio 3 distinguen los puntos de conexión en línea gestionados de la inferencia personalizada basada en Functions por razones de cold-start, tamaño de payload o costo.
Plataforma de identidad que proporciona autenticación de usuarios/entidades de servicio, identidades gestionadas, roles RBAC y acceso condicional para cada recurso de Azure ML.
Por qué está en el examen: La configuración del espacio de trabajo del Dominio 1 y los escenarios de control de acceso de despliegue del Dominio 3 nombran a las identidades gestionadas de Entra ID como la forma nativa de AAD para autorizar cómputo y puntos de conexión.
Almacén gestionado de secretos, claves y certificados para cadenas de conexión, claves de API de modelos y claves gestionadas por el cliente que protegen los datos de entrenamiento y artefactos.
Por qué está en el examen: El cifrado de datos del espacio de trabajo de Azure ML con claves gestionadas por el cliente y la recuperación de secretos de los trabajos de entrenamiento nombran a Key Vault como la respuesta en el Dominio 1.
Cobertura de métricas, registros, alertas y Application Insights para puntos de conexión de Azure ML, trabajos de entrenamiento y señales de deriva de datos a través de espacios de trabajo de Log Analytics.
Por qué está en el examen: Los escenarios de monitoreo de producción del Dominio 3 evalúan Azure Monitor + Log Analytics para alertas de latencia/errores de puntos de conexión y para presentar detecciones de deriva de modelos a los equipos de operaciones.
Gobernanza de datos unificada para escanear almacenes de datos, clasificar datos sensibles, mapear el linaje y aplicar políticas de acceso en todo el patrimonio analítico.
Por qué está en el examen: Las preguntas de IA responsable y gobernanza de datos en los Dominios 1 y 4 hacen referencia a Purview para el linaje de datos de entrenamiento, la clasificación de PII y las puertas de liberación de modelos conscientes del linaje.
$115k–$165k–$230k USD anual
El rango cubre científicos de datos de nivel medio a senior con sede en EE. UU. donde se requiere dominio de Azure ML. Los científicos aplicados de FAANG / unicornio a menudo superan los $300k TC. La certificación es una señal de selección; la experiencia demostrada en modelado y la presencia en publicaciones / kaggle / código abierto impulsan el extremo superior.
Fuente: Roles de científico de datos / ingeniero de ML de levels.fyi 2025, U.S. BLS OEWS mayo 2024 (15-2051 científicos de datos, 15-2099 científicos de ML), Glassdoor 2025. Las cifras son aproximadas; la compensación real depende del rol, la región y la experiencia.
DP-100 ha mantenido una demanda constante a medida que las empresas operacionalizan ML en Azure ML y, cada vez más, en Azure AI Foundry. Los reclutadores lo consideran el punto de prueba canónico de Azure ML — muy útil para científicos de datos que necesitan demostrar que pueden ir más allá de un cuaderno e implementar soluciones en puntos de conexión y pipelines administrados. El dominio de optimización de LLM de 2024 también ha hecho que DP-100 sea más atractivo para los ingenieros de GenAI. Se combina naturalmente con AI-102 para ingenieros que construyen aplicaciones GenAI de producción y con DP-203 / DP-700 para profesionales de ML con inclinación a la ingeniería de datos.
No existen prerrequisitos formales, pero DP-100 asume habilidades de ciencia de datos a nivel de profesional. El esquema de Microsoft espera fluidez en Python, el stack scikit-learn / pandas / NumPy y el flujo de trabajo central de ML (dividir, entrenar, evaluar, implementar). DP-900 es una introducción conceptual útil para candidatos nuevos en los servicios de datos de Azure, pero no es obligatoria.
La ruta oficial de Microsoft Learn cubre los cuatro dominios en aproximadamente 30-40 horas, centrándose en Azure ML SDK / CLI v2 y prompt flow. Es esencial el tiempo práctico: una suscripción personal de Azure con un pequeño espacio de trabajo de Azure ML, además de más de 10 horas ejecutando trabajos de entrenamiento reales, implementaciones de modelos y ejecuciones de prompt-flow. El dominio de optimización de LLM de 2024 está poco cubierto por material de terceros más antiguo, por lo que los candidatos deben confiar en los módulos de Microsoft Learn para esa área.
DP-100 se encuentra en el nivel Asociado y generalmente se considera de dificultad moderada — más fácil que AZ-204 / AI-102 para científicos de datos experimentados, más difícil para ingenieros nuevos en ML. Planifique de 60 a 100 horas de estudio durante 6 a 10 semanas con experiencia previa en ciencia de datos; considerablemente más si Python ML es nuevo para usted. El examen dura aproximadamente 100 minutos con 40 a 60 preguntas en formatos de opción múltiple, respuesta múltiple, arrastrar y soltar (incluida la finalización de código), hot-area y estudio de caso.
El obstáculo más común son los detalles específicos de Azure ML SDK / CLI v2 — la reciente migración de Microsoft del SDK v1 al v2 inutilizó muchas guías de estudio de terceros, por lo que el material más antiguo puede mostrar YAML y formas de comando obsoletos. El nuevo dominio de optimización de LLM (prompt flow, ajuste fino, evaluación) tiene su propia curva de aprendizaje y tiende a sorprender a los candidatos que consideraban el DP-100 como un examen de ML clásico.
Actualización importante que añade el dominio de optimización de LLM (28% de peso), moderniza el material de trabajos de entrenamiento y despliegue a Azure ML SDK / CLI v2, e integra conceptos de Azure AI Foundry. Microsoft actualiza DP-100 aproximadamente cada 12 a 18 meses sin cambiar el código del examen.
Migración del SDK v1 de Azure ML al marco de SDK / CLI v2, retirada de preguntas centradas en el diseñador de Azure ML y adición de cobertura de integración con MLflow.
Disponibilidad general inicial (GA), reemplazando el DP-100 retirado (código heredado). El esquema original se centraba en el diseñador de Azure ML, AutoML y el SDK v1.
DP-100 (Microsoft Azure Data Scientist Associate) es un examen de nivel Associate un examen de dificultad moderada que espera experiencia práctica y una sólida comprensión de las mejores prácticas. La mayoría de los candidatos necesitan entre 80 y 150 horas de estudio distribuidas en 6 a 12 semanas para los exámenes de nivel asociado. La mayoría de los candidatos que obtienen consistentemente una puntuación por encima del umbral de aprobación en los exámenes de práctica, aprueban en su primer intento.
La mayoría de los candidatos necesitan entre 80 y 150 horas de estudio distribuidas en 6 a 12 semanas para los exámenes de nivel asociado. El tiempo para aprobar varía ampliamente según la experiencia previa. Los ingenieros con experiencia práctica en producción en la tecnología subyacente suelen necesitar menos; los candidatos nuevos en la plataforma deben planificar hacia el extremo superior de ese rango.
DP-100 es una credencial reconocida en el ecosistema de Azure y señala conocimientos validados a empleadores, reclutadores y clientes. Si vale la pena el tiempo y la tarifa para ti, depende de tu rol y objetivos — tiende a ser más rentable para ingenieros de la nube, arquitectos y consultores que trabajan con Azure a diario o quieren pasar a roles que lo hagan.
La puntuación de aprobación para DP-100 es 700 / 1000. El examen contiene 50 preguntas y dura 1 h 40 min.
La tarifa del examen DP-100 es de $165 USD. Las tarifas son establecidas por Azure y pueden variar según la región; siempre confirma el precio actual en la página oficial de certificación de Azure antes de reservar.
Las certificaciones basadas en roles de Microsoft expiran después de 1 año, pero pueden renovarse de forma gratuita a través de una evaluación en línea sin supervisión en Microsoft Learn, a partir de 6 meses antes de la caducidad.
Sí. Puedes realizar el examen en línea (supervisado a través del navegador seguro del proveedor, disponible 24/7 en la mayoría de las regiones) o en un centro de examen presencial de Pearson VUE durante el horario comercial. Ambos formatos utilizan las mismas preguntas, límite de tiempo y puntuación de aprobación.
CertLabPro ofrece 15 modos de estudio en todo el banco de preguntas de práctica para DP-100. El modo de simulación de examen reproduce el examen real: 50 preguntas en 1 h 40 min, con el mismo umbral de aprobación de 700 / 1000. El modo de navegación te permite leer todas las preguntas y respuestas de forma estática.