AWS Data Engineer Associate (DEA-C01) : la nouvelle certification en vaut-elle la peine ?
AWS a lancé le DEA-C01 en mars 2024 pour combler le fossé entre les rÎles d'analyste de données et l'ingénierie cloud. Voici si cela vaut votre temps.
Le DEA-C01 en vaut la peine si vous construisez des pipelines de donnĂ©es sur AWS pour gagner votre vie. Pour tous les autres â ingĂ©nieurs cloud gĂ©nĂ©ralistes, analystes BI, scientifiques de donnĂ©es qui touchent occasionnellement Ă l'infrastructure â le SAA-C03 est le titre de compĂ©tence le plus utile, et vous ne manquez pas grand-chose en ignorant le DEA-C01.
C'est la réponse courte. La réponse plus longue implique de comprendre pourquoi AWS a lancé cette certification en premier lieu, ce qu'elle a remplacé, et le créneau de carriÚre étonnamment spécifique qu'elle dessert.
Qu'est-ce qui a remplacé quoi
AWS a retirĂ© la certification Data Analytics Specialty (DAS-C01) en avril 2024, parallĂšlement au lancement du DEA-C01 en mars 2024. Ce ne sont pas les mĂȘmes examens. Le Data Analytics Specialty Ă©tait de niveau spĂ©cialitĂ© (300 USD) et s'appuyait davantage sur les outils cĂŽtĂ© analytique â QuickSight, Athena, Lake Formation, Kinesis Data Analytics. Le DEA-C01 est de niveau associĂ© (150 USD) et se penche vers les outils cĂŽtĂ© ingĂ©nierie â Glue, EMR, DMS, Step Functions, la pile d'orchestration et d'ingestion.
Ce changement correspond au marchĂ©. Les emplois d'"analyste de donnĂ©es" qui nĂ©cessitaient de lancer des requĂȘtes SQL sur un cluster Redshift sont absorbĂ©s depuis des annĂ©es par les outils de BI en libre-service et l'analyse assistĂ©e par ML. Les emplois d'"ingĂ©nieur de donnĂ©es" â construire les pipelines, le lakehouse, l'ingestion de flux â ont augmentĂ©. AWS a ajustĂ© son portefeuille de certifications en consĂ©quence.
Si vous dĂ©teniez le DAS-C01 et qu'il a expirĂ©, vous n'ĂȘtes pas automatiquement Ă©ligible au DEA-C01. Vous devez passer le nouvel examen. AWS n'a pas prĂ©cisĂ© s'ils effectueront des transferts de reconnaissance ; d'aprĂšs la maniĂšre dont ils ont gĂ©rĂ© le changement de nom du SOA (pas de transfert, passez le nouvel examen si vous voulez le nouveau badge), je suppose que non.
Ce qui est testé
Quatre domaines :
- Ingestion et transformation des données (34 %)
- Gestion du stockage des données (26 %)
- Opérations et support des données (22 %)
- Sécurité et gouvernance des données (18 %)
La pondĂ©ration des domaines est significative. L'ingestion et la transformation sont de loin la plus grande part. AWS ne teste pas si vous pouvez choisir le bon outil de BI â ils testent si vous pouvez construire la plomberie des donnĂ©es.
Services spécifiques qui apparaissent fréquemment :
AWS Glue. Crawlers, jobs, le Data Catalog, DataBrew, Glue Studio, Glue Streaming. Probablement 8 à 10 questions reposent uniquement sur Glue. Vous devez connaßtre la différence entre les jobs Glue Spark et les jobs Glue Python Shell, quand utiliser Glue Studio par rapport au PySpark écrit à la main, et comment le Data Catalog interagit avec Athena et Redshift Spectrum.
Amazon Athena. ModĂšles de requĂȘtes, partitionnement, requĂȘtes fĂ©dĂ©rĂ©es, workgroups, CTAS, mise en cache des rĂ©sultats de requĂȘtes. Athena est l'option par dĂ©faut Ă©conomique, rapide et flexible pour l'interrogation ad-hoc des donnĂ©es S3, et l'examen teste si vous connaissez ses limites et son modĂšle de tarification.
EMR. EMR sur EC2 vs EMR Serverless vs EMR sur EKS. Spark, Hive, Presto, Trino, HBase. Dimensionnement des clusters et types d'instances. L'examen met fortement l'accent sur EMR, en partie parce qu'AWS veut le différencier de Glue (Glue pour l'ETL sans serveur, EMR pour l'écosystÚme open-source de Big Data avec plus de contrÎle).
Amazon Kinesis. Data Streams, Data Firehose (anciennement Kinesis Data Firehose), Data Analytics for Apache Flink (anciennement Kinesis Data Analytics). Calcul des shards, fenĂȘtres de rĂ©tention, la diffĂ©rence entre Streams et Firehose. Le streaming est une partie significative du domaine d'ingestion.
Amazon Redshift. Types de clusters, RA3 vs DC2, Redshift Serverless, Redshift Spectrum, vues matérialisées, clés de distribution, clés de tri, VACUUM et ANALYZE. Optimisation des performances au niveau de la table.
AWS DMS (Database Migration Service). Chargement complet vs CDC, réplication continue, points de terminaison source et cible, DMS Schema Conversion. Fort accent sur les scénarios de migration.
AWS Lake Formation. Permissions, tables gouvernées, contrÎle d'accÚs granulaire sur le Data Catalog. Le domaine Sécurité et Gouvernance s'appuie sur cela.
Step Functions, EventBridge, Lambda. Orchestration et modÚles basés sur les événements. Moins de profondeur que la couverture du DVA-C02, mais suffisant pour reconnaßtre le bon outil d'orchestration pour un pipeline donné.
Niveaux de stockage S3 et politiques de cycle de vie pour les charges de travail analytiques. MĂȘme contenu que le SAA-C03, appliquĂ© aux scĂ©narios d'ingĂ©nierie des donnĂ©es.
Ce qui n'est pas testé en profondeur : SageMaker (c'est le territoire du MLA-C01), QuickSight (couverture plus légÚre que celle du DAS-C01), les modÚles d'inférence ML en temps réel, les mécanismes internes profonds de Spark.
Qui en bénéficie le plus
IngĂ©nieurs de donnĂ©es dĂ©ployant des pipelines ETL sur AWS. C'est le cas Ă©vident. Si votre travail quotidien consiste Ă Ă©crire des jobs Glue, gĂ©rer des entrepĂŽts Redshift, construire l'ingestion Kinesis ou migrer des bases de donnĂ©es via DMS, le contenu de la certification correspond directement Ă votre travail. Ătudier pour le DEA-C01 rĂ©vĂ©lera des lacunes dans les services que vous n'avez peut-ĂȘtre pas touchĂ©s (la plupart des ingĂ©nieurs de donnĂ©es connaissent Glue et Redshift par cĆur mais sont faibles sur Lake Formation ou DataZone).
IngĂ©nieurs backend se tournant vers l'ingĂ©nierie des donnĂ©es. Si vous ĂȘtes un ingĂ©nieur logiciel avec de l'expĂ©rience AWS et que vous essayez d'accĂ©der Ă un rĂŽle d'ingĂ©nieur de donnĂ©es, le DEA-C01 est un signal crĂ©dible que vous comprenez l'Ă©cosystĂšme. C'est un titre de compĂ©tence plus ciblĂ© que le SAA-C03 pour les responsables du recrutement recherchant spĂ©cifiquement des ingĂ©nieurs de donnĂ©es.
Consultants chez les entreprises partenaires AWS avec des pratiques de données. Les cabinets de conseil ont besoin d'employés certifiés dans des domaines spécifiques pour l'éligibilité aux niveaux de partenariat. Le DEA-C01 remplit le créneau de spécialisation en ingénierie des données.
Qui devrait l'ignorer
Ingénieurs cloud généralistes / DevOps. Si vous ne travaillez pas spécifiquement sur des pipelines de données, le contenu de la certification est trop étroit pour valoir 80 à 120 heures de préparation. Le SAA-C03 couvre une surface de services plus large et est plus reconnu.
Scientifiques de donnĂ©es / ingĂ©nieurs ML. Votre chaĂźne d'outils est SageMaker, MLflow, pipelines d'entraĂźnement, dĂ©ploiement de modĂšles. AWS a des certifications distinctes pour ce travail â MLA-C01 (Machine Learning Engineer Associate) et AIF-C01 (AI Practitioner). Le DEA-C01 n'est pas alignĂ© avec ce que vous faites.
Quiconque l'envisage comme une "premiĂšre certification AWS". Le DEA-C01 est de niveau associĂ©. Il suppose que vous connaissez dĂ©jĂ les fondamentaux d'AWS â IAM, VPC, S3, Lambda â au niveau CLF-C02. S'y lancer Ă froid est difficile. Passez d'abord le CLF-C02 si vous n'avez pas le vocabulaire, ou le SAA-C03 si vous voulez une base plus large.
Marché de l'emploi et salaire
La rĂ©munĂ©ration en ingĂ©nierie des donnĂ©es a Ă©tĂ© l'une des plus dynamiques du marchĂ© des donnĂ©es entre 2024 et 2026. Les donnĂ©es de levels.fyi pour les rĂŽles d'"IngĂ©nieur de donnĂ©es" placent la rĂ©munĂ©ration de base aux Ătats-Unis entre 115 000 et 185 000 $ pour les niveaux intermĂ©diaires, les rĂŽles seniors atteignant 160 000 Ă 230 000 $ de base dans les grandes mĂ©tropoles technologiques. La rĂ©munĂ©ration totale dans les grandes entreprises technologiques (ingĂ©nieurs de donnĂ©es Amazon L5/L6, ingĂ©nieurs de donnĂ©es Meta E5/E6) dĂ©passe rĂ©guliĂšrement les 300 000 $.
Les données de mai 2024 du BLS OEWS (Bureau of Labor Statistics Occupational Employment Statistics) américain classent les ingénieurs de données sous la catégorie "Administrateurs et architectes de bases de données" (15-1245), avec une médiane d'environ 103 000 $ et un 90e percentile d'environ 164 000 $. Cela sous-estime spécifiquement l'ingénieur de données AWS car le BLS regroupe les rÎles d'administrateurs de bases de données traditionnels.
Le DEA-C01 est trop récent pour disposer de données significatives sur les salaires. De maniÚre anecdotique, les titulaires rapportent de modestes améliorations dans le processus d'entretien (plus de recruteurs les contactent, conversion plus rapide du screening à l'entretien sur site) mais pas de différence de rémunération constante par rapport aux ingénieurs de données non certifiés ayant une expérience similaire. La certification n'a que quatorze mois en avril 2026 ; il faudra encore un an ou deux avant qu'elle n'apparaisse clairement dans les données de rémunération.
La valeur professionnelle de la certification est davantage liĂ©e Ă la clartĂ© du rĂŽle qu'au salaire. Elle indique que vous construisez spĂ©cifiquement des pipelines de donnĂ©es, ce qui vous aide Ă ĂȘtre filtrĂ© vers les bonnes offres d'emploi au lieu de postuler largement avec le SAA-C03 et d'ĂȘtre associĂ© Ă des rĂŽles d'architecte que vous ne souhaitez pas.
Temps d'étude et préparation
FenĂȘtre de certification AWS de niveau associĂ© standard : 80 Ă 150 heures. Le DEA-C01 tend spĂ©cifiquement vers le haut de cette fourchette car la surface des services est vaste et plusieurs services (Glue, Lake Formation, EMR Serverless) sont suffisamment complexes opĂ©rationnellement pour que la lecture seule ne suffise pas â il faut les utiliser.
Arc de préparation suggéré :
- Semaines 1 à 3 : Le plan d'apprentissage Data Engineer d'AWS Skill Builder (couverture gratuite décente), plus la lecture de la documentation AWS Glue, Athena et Redshift. Ne sautez pas la documentation. L'examen pose des questions spécifiques sur les paramÚtres des jobs Glue et les clés de distribution Redshift qui sont documentées mais pas toujours couvertes dans les préparations tierces.
- Semaines 4 Ă 6 : Pratique. Construisez un pipeline de bout en bout. Ingestez des donnĂ©es d'un flux Kinesis vers S3 via Firehose, explorez-les avec Glue, interrogez-les avec Athena, transformez-les avec un job ETL Glue, chargez-les dans Redshift. MĂȘme Ă petite Ă©chelle, faire cela une fois vous en apprend plus que de le lire trois fois.
- Semaines 7 à 8 : Pratique de scénarios. Parcourez la banque de questions DEA-C01 sur CertLabPro pour une pratique d'examen chronométrée. Visez deux scores de pratique consécutifs de 80 % ou plus avant de planifier l'examen.
En résumé
Le DEA-C01 est une certification de niche servant un crĂ©neau rĂ©el et en croissance. Si vous ĂȘtes dĂ©jĂ un ingĂ©nieur de donnĂ©es ou souhaitez le devenir, passez-le. Si vous n'ĂȘtes pas encore sĂ»r de vouloir vous spĂ©cialiser dans l'ingĂ©nierie des donnĂ©es, passez d'abord le SAA-C03 â il est plus reconnu, plus gĂ©nĂ©ral, et vous pourrez revenir au DEA-C01 plus tard si la spĂ©cialisation a du sens.
La certification est trop rĂ©cente pour des affirmations salariales fiables, et quiconque vous dit qu'elle ajoutera 20 000 $ Ă votre rĂ©munĂ©ration fait des suppositions. L'argument honnĂȘte est le suivant : c'est un titre de compĂ©tence valide et approuvĂ© par AWS pour un rĂŽle qui recrute fortement jusqu'en 2026. C'est suffisant.