AWS Data Engineer Associate (DEA-C01): ¿Vale la pena la nueva certificación?
AWS lanzó DEA-C01 en marzo de 2024 para cubrir la brecha entre los roles de análisis de datos y la ingeniería en la nube. Aquí te decimos si vale la pena tu tiempo.
DEA-C01 vale la pena si construyes pipelines de datos en AWS para ganarte la vida. Para todos los demás (ingenieros de la nube generalistas, analistas de BI, científicos de datos que ocasionalmente interactúan con la infraestructura), SAA-C03 es la credencial más útil, y realmente no te pierdes mucho al omitir DEA-C01.
Esa es la respuesta corta. La respuesta más larga implica entender por qué AWS lanzó esta certificación en primer lugar, qué reemplazó y el nicho profesional sorprendentemente específico al que sirve.
Qué reemplazó a qué
AWS retiró la certificación Data Analytics Specialty (DAS-C01) en abril de 2024, junto con el lanzamiento de DEA-C01 en marzo de 2024. No son el mismo examen. Data Analytics Specialty era de nivel de especialidad ($300 USD) y se inclinaba más hacia herramientas del lado del análisis: QuickSight, Athena, Lake Formation, Kinesis Data Analytics. DEA-C01 es de nivel asociado ($150 USD) y se inclina hacia herramientas del lado de la ingeniería: Glue, EMR, DMS, Step Functions, la pila de orquestación e ingesta.
El cambio coincide con el mercado. Los trabajos de "analista de datos" que requerían que alguien ejecutara SQL contra un clúster de Redshift han sido absorbidos por herramientas de BI de autoservicio y análisis asistido por ML durante años. Los trabajos de "ingeniero de datos" (construir los pipelines, el lakehouse, la ingesta de streaming) han crecido. AWS ajustó el portfolio de certificaciones en consecuencia.
Si tenías DAS-C01 y expiró, no se te incorpora automáticamente a DEA-C01. Tienes que hacer el nuevo examen. AWS no ha dicho si hará transferencias de reconocimiento; basándose en cómo manejaron el cambio de nombre de SOA (sin transferencia, haz el nuevo examen si quieres la nueva insignia), asumo que no.
Qué se evalúa
Cuatro dominios:
- Ingesta y Transformación de Datos (34%)
- Gestión de Almacenes de Datos (26%)
- Operaciones y Soporte de Datos (22%)
- Seguridad y Gobernanza de Datos (18%)
El peso de los dominios es significativo. Ingesta y Transformación es, con mucho, la porción más grande. AWS no evalúa si puedes elegir la herramienta de BI adecuada, sino si puedes construir la infraestructura de datos.
Servicios específicos que aparecen con mucha frecuencia:
AWS Glue. Crawlers, jobs, el Data Catalog, DataBrew, Glue Studio, Glue Streaming. Probablemente 8-10 preguntas dependen solo de Glue. Necesitas saber la diferencia entre los trabajos Glue Spark y los trabajos Glue Python Shell, cuándo usar Glue Studio vs PySpark escrito a mano, y cómo el Data Catalog interactúa con Athena y Redshift Spectrum.
Amazon Athena. Patrones de consulta, particionamiento, consultas federadas, grupos de trabajo, CTAS, caché de resultados de consulta. Athena es la opción predeterminada barata, rápida y flexible para consultas ad-hoc de datos de S3, y el examen evalúa si conoces sus límites y modelo de precios.
EMR. EMR en EC2 vs EMR Serverless vs EMR en EKS. Spark, Hive, Presto, Trino, HBase. Dimensionamiento de clústeres y tipos de instancias. El examen evalúa EMR con intensidad, en parte porque AWS quiere diferenciarlo de Glue (Glue para ETL sin servidor, EMR para el ecosistema de big data de código abierto con más control).
Amazon Kinesis. Data Streams, Data Firehose (anteriormente Kinesis Data Firehose), Data Analytics para Apache Flink (anteriormente Kinesis Data Analytics). Matemáticas de sharding, ventanas de retención, la diferencia entre Streams y Firehose. El streaming es una parte significativa del dominio de ingesta.
Amazon Redshift. Tipos de clústeres, RA3 vs DC2, Redshift Serverless, Redshift Spectrum, vistas materializadas, claves de distribución, claves de ordenación, VACUUM y ANALYZE. Optimización del rendimiento a nivel de tabla.
AWS DMS (Database Migration Service). Carga completa vs CDC, replicación continua, puntos finales de origen y destino, DMS Schema Conversion. Muy centrado en escenarios de migración.
AWS Lake Formation. Permisos, tablas gobernadas, control de acceso granular sobre el Data Catalog. El dominio de Seguridad y Gobernanza se apoya en esto.
Step Functions, EventBridge, Lambda. Patrones de orquestación y basados en eventos. Menos profundidad que la cobertura de DVA-C02, pero suficiente para reconocer la herramienta de orquestación adecuada para un pipeline determinado.
Niveles de almacenamiento S3 y políticas de ciclo de vida para cargas de trabajo de análisis. El mismo contenido que SAA-C03, aplicado a escenarios de ingeniería de datos.
Lo que no se evalúa en profundidad: SageMaker (ese es el territorio de MLA-C01), QuickSight (cobertura más ligera que la que tenía DAS-C01), patrones de inferencia de ML en tiempo real, detalles internos profundos de Spark.
Quiénes se benefician más
Ingenieros de datos que implementan pipelines ETL en AWS. Este es el caso obvio. Si tu trabajo diario es escribir trabajos de Glue, gestionar almacenes de Redshift, construir ingesta con Kinesis o migrar bases de datos a través de DMS, el contenido de la certificación se mapea directamente a tu trabajo. Estudiar para DEA-C01 sacará a la luz lagunas en servicios que quizás no hayas tocado (la mayoría de los ingenieros de datos conocen Glue y Redshift a fondo, pero son débiles en Lake Formation o DataZone).
Ingenieros de backend que pivotan hacia la ingeniería de datos. Si eres un ingeniero de software con experiencia en AWS que intenta ingresar a un rol de ingeniería de datos, DEA-C01 es una señal creíble de que comprendes el ecosistema. Es una credencial más específica que SAA-C03 para los gerentes de contratación que buscan específicamente ingenieros de datos.
Consultores en empresas AWS Partner con prácticas de datos. Las consultoras necesitan empleados certificados en dominios específicos para la elegibilidad a nivel de socio. DEA-C01 ocupa el puesto de especialización en ingeniería de datos.
Quiénes deberían omitirla
Ingenieros de la nube generalistas / DevOps. Si no trabajas específicamente en pipelines de datos, el contenido de la certificación es demasiado limitado como para valer 80-120 horas de preparación. SAA-C03 cubre una superficie de servicios más amplia y es más reconocida.
Científicos de datos / ingenieros de ML. Tu conjunto de herramientas es SageMaker, MLflow, pipelines de entrenamiento, despliegue de modelos. AWS tiene certificaciones separadas para ese trabajo: MLA-C01 (Machine Learning Engineer Associate) y AIF-C01 (AI Practitioner). DEA-C01 no está alineada con lo que haces.
Cualquiera que la considere como una "primera certificación de AWS". DEA-C01 es de nivel asociado. Asume que ya conoces los fundamentos de AWS (IAM, VPC, S3, Lambda) al nivel de CLF-C02. Empezar sin conocimientos previos es difícil. Haz CLF-C02 primero si no tienes el vocabulario, o SAA-C03 primero si quieres una base más amplia.
Mercado laboral y salario
La compensación en ingeniería de datos ha sido una de las partes más agresivas del mercado de datos entre 2024 y 2026. Los datos de levels.fyi para roles de "Ingeniero de Datos" sitúan la compensación base en EE. UU. en $115k–$185k para nivel medio, con roles senior en $160k–$230k de base en las principales ciudades tecnológicas. La compensación total en grandes tecnológicas (ingenieros de datos Amazon L5/L6, Meta E5/E6) rutinariamente supera los $300k.
Los datos del U.S. BLS OEWS de mayo de 2024 clasifican a los ingenieros de datos bajo "Administradores y Arquitectos de Bases de Datos" (15-1245), con una mediana de alrededor de $103k y un percentil 90 de alrededor de $164k. Esto subestima específicamente al ingeniero de datos de AWS porque el BLS agrupa roles de DBA heredados.
DEA-C01 es demasiado nueva para tener datos significativos sobre las señales salariales por sí misma. Anecdóticamente, los titulares están reportando modestos aumentos en el flujo de entrevistas (más reclutadores contactando, conversión más rápida de filtro a entrevista presencial), pero ninguna diferencia salarial consistente frente a ingenieros de datos sin certificar con experiencia similar. La certificación tiene solo catorce meses de antigüedad a partir de abril de 2026; tomará uno o dos años más antes de que aparezca claramente en los datos de compensación.
El valor profesional de la certificación se trata más de la claridad del rol que del salario. Señala que construyes específicamente pipelines de datos, lo que te ayuda a ser filtrado en las ofertas de trabajo correctas en lugar de aplicar ampliamente con SAA-C03 y ser emparejado con roles de arquitecto que no deseas.
Tiempo de estudio y preparación
Ventana estándar para la certificación de asociado de AWS: 80–150 horas. DEA-C01 tiende a estar en el extremo superior porque la superficie de servicios es amplia y varios servicios (Glue, Lake Formation, EMR Serverless) son operacionalmente complejos, tanto que leer sobre ellos no es suficiente; tienes que usarlos.
Arco de preparación sugerido:
- Semanas 1-3: Plan de aprendizaje de Data Engineer de AWS Skill Builder (cobertura gratuita decente), además de leer la documentación de AWS Glue, Athena y Redshift. No omitas la documentación. El examen hace preguntas específicas sobre los parámetros de los trabajos de Glue y las claves de distribución de Redshift que están documentadas pero no siempre cubiertas en la preparación de terceros.
- Semanas 4-6: práctica. Construye un pipeline de extremo a extremo. Ingesta datos de un stream de Kinesis en S3 a través de Firehose, rastréalos con Glue, consúltalos con Athena, transfórmalos con un trabajo ETL de Glue, cárgalos en Redshift. Incluso a pequeña escala, hacer esto una vez te enseña más que leer sobre ello tres veces.
- Semanas 7-8: práctica de escenarios. Explora el banco de preguntas de DEA-C01 en CertLabPro para la práctica de examen cronometrada. Intenta obtener dos puntuaciones de práctica consecutivas del 80%+ antes de programar el examen.
Conclusión
DEA-C01 es una certificación de nicho que sirve a un nicho real y creciente. Si ya eres un ingeniero de datos o quieres serlo, hazla. Si aún no estás seguro de si quieres especializarte en ingeniería de datos, haz SAA-C03 primero; es más reconocida, más general, y puedes volver a DEA-C01 más tarde si la especialización tiene sentido.
La certificación es demasiado nueva para afirmaciones salariales confiables, y cualquiera que te diga que agregará $20k a tu salario está adivinando. La propuesta honesta es: es una credencial válida y avalada por AWS para un rol que está contratando fuertemente hasta 2026. Eso es suficiente.