AWS Data Engineer Associate (DEA-C01) : la nouvelle certification en vaut-elle la peine ?
AWS a lancé le DEA-C01 en mars 2024 pour combler le fossé entre les rôles d'analyste de données et l'ingénierie cloud. Voici si cela vaut votre temps.
Le DEA-C01 en vaut la peine si vous construisez des pipelines de données sur AWS pour gagner votre vie. Pour tous les autres — ingénieurs cloud généralistes, analystes BI, scientifiques de données qui touchent occasionnellement à l'infrastructure — le SAA-C03 est le titre de compétence le plus utile, et vous ne manquez pas grand-chose en ignorant le DEA-C01.
C'est la réponse courte. La réponse plus longue implique de comprendre pourquoi AWS a lancé cette certification en premier lieu, ce qu'elle a remplacé, et le créneau de carrière étonnamment spécifique qu'elle dessert.
Qu'est-ce qui a remplacé quoi
AWS a retiré la certification Data Analytics Specialty (DAS-C01) en avril 2024, parallèlement au lancement du DEA-C01 en mars 2024. Ce ne sont pas les mêmes examens. Le Data Analytics Specialty était de niveau spécialité (300 USD) et s'appuyait davantage sur les outils côté analytique — QuickSight, Athena, Lake Formation, Kinesis Data Analytics. Le DEA-C01 est de niveau associé (150 USD) et se penche vers les outils côté ingénierie — Glue, EMR, DMS, Step Functions, la pile d'orchestration et d'ingestion.
Ce changement correspond au marché. Les emplois d'"analyste de données" qui nécessitaient de lancer des requêtes SQL sur un cluster Redshift sont absorbés depuis des années par les outils de BI en libre-service et l'analyse assistée par ML. Les emplois d'"ingénieur de données" — construire les pipelines, le lakehouse, l'ingestion de flux — ont augmenté. AWS a ajusté son portefeuille de certifications en conséquence.
Si vous déteniez le DAS-C01 et qu'il a expiré, vous n'êtes pas automatiquement éligible au DEA-C01. Vous devez passer le nouvel examen. AWS n'a pas précisé s'ils effectueront des transferts de reconnaissance ; d'après la manière dont ils ont géré le changement de nom du SOA (pas de transfert, passez le nouvel examen si vous voulez le nouveau badge), je suppose que non.
Ce qui est testé
Quatre domaines :
- Ingestion et transformation des données (34 %)
- Gestion du stockage des données (26 %)
- Opérations et support des données (22 %)
- Sécurité et gouvernance des données (18 %)
La pondération des domaines est significative. L'ingestion et la transformation sont de loin la plus grande part. AWS ne teste pas si vous pouvez choisir le bon outil de BI — ils testent si vous pouvez construire la plomberie des données.
Services spécifiques qui apparaissent fréquemment :
AWS Glue. Crawlers, jobs, le Data Catalog, DataBrew, Glue Studio, Glue Streaming. Probablement 8 à 10 questions reposent uniquement sur Glue. Vous devez connaître la différence entre les jobs Glue Spark et les jobs Glue Python Shell, quand utiliser Glue Studio par rapport au PySpark écrit à la main, et comment le Data Catalog interagit avec Athena et Redshift Spectrum.
Amazon Athena. Modèles de requêtes, partitionnement, requêtes fédérées, workgroups, CTAS, mise en cache des résultats de requêtes. Athena est l'option par défaut économique, rapide et flexible pour l'interrogation ad-hoc des données S3, et l'examen teste si vous connaissez ses limites et son modèle de tarification.
EMR. EMR sur EC2 vs EMR Serverless vs EMR sur EKS. Spark, Hive, Presto, Trino, HBase. Dimensionnement des clusters et types d'instances. L'examen met fortement l'accent sur EMR, en partie parce qu'AWS veut le différencier de Glue (Glue pour l'ETL sans serveur, EMR pour l'écosystème open-source de Big Data avec plus de contrôle).
Amazon Kinesis. Data Streams, Data Firehose (anciennement Kinesis Data Firehose), Data Analytics for Apache Flink (anciennement Kinesis Data Analytics). Calcul des shards, fenêtres de rétention, la différence entre Streams et Firehose. Le streaming est une partie significative du domaine d'ingestion.
Amazon Redshift. Types de clusters, RA3 vs DC2, Redshift Serverless, Redshift Spectrum, vues matérialisées, clés de distribution, clés de tri, VACUUM et ANALYZE. Optimisation des performances au niveau de la table.
AWS DMS (Database Migration Service). Chargement complet vs CDC, réplication continue, points de terminaison source et cible, DMS Schema Conversion. Fort accent sur les scénarios de migration.
AWS Lake Formation. Permissions, tables gouvernées, contrôle d'accès granulaire sur le Data Catalog. Le domaine Sécurité et Gouvernance s'appuie sur cela.
Step Functions, EventBridge, Lambda. Orchestration et modèles basés sur les événements. Moins de profondeur que la couverture du DVA-C02, mais suffisant pour reconnaître le bon outil d'orchestration pour un pipeline donné.
Niveaux de stockage S3 et politiques de cycle de vie pour les charges de travail analytiques. Même contenu que le SAA-C03, appliqué aux scénarios d'ingénierie des données.
Ce qui n'est pas testé en profondeur : SageMaker (c'est le territoire du MLA-C01), QuickSight (couverture plus légère que celle du DAS-C01), les modèles d'inférence ML en temps réel, les mécanismes internes profonds de Spark.
Qui en bénéficie le plus
Ingénieurs de données déployant des pipelines ETL sur AWS. C'est le cas évident. Si votre travail quotidien consiste à écrire des jobs Glue, gérer des entrepôts Redshift, construire l'ingestion Kinesis ou migrer des bases de données via DMS, le contenu de la certification correspond directement à votre travail. Étudier pour le DEA-C01 révélera des lacunes dans les services que vous n'avez peut-être pas touchés (la plupart des ingénieurs de données connaissent Glue et Redshift par cœur mais sont faibles sur Lake Formation ou DataZone).
Ingénieurs backend se tournant vers l'ingénierie des données. Si vous êtes un ingénieur logiciel avec de l'expérience AWS et que vous essayez d'accéder à un rôle d'ingénieur de données, le DEA-C01 est un signal crédible que vous comprenez l'écosystème. C'est un titre de compétence plus ciblé que le SAA-C03 pour les responsables du recrutement recherchant spécifiquement des ingénieurs de données.
Consultants chez les entreprises partenaires AWS avec des pratiques de données. Les cabinets de conseil ont besoin d'employés certifiés dans des domaines spécifiques pour l'éligibilité aux niveaux de partenariat. Le DEA-C01 remplit le créneau de spécialisation en ingénierie des données.
Qui devrait l'ignorer
Ingénieurs cloud généralistes / DevOps. Si vous ne travaillez pas spécifiquement sur des pipelines de données, le contenu de la certification est trop étroit pour valoir 80 à 120 heures de préparation. Le SAA-C03 couvre une surface de services plus large et est plus reconnu.
Scientifiques de données / ingénieurs ML. Votre chaîne d'outils est SageMaker, MLflow, pipelines d'entraînement, déploiement de modèles. AWS a des certifications distinctes pour ce travail — MLA-C01 (Machine Learning Engineer Associate) et AIF-C01 (AI Practitioner). Le DEA-C01 n'est pas aligné avec ce que vous faites.
Quiconque l'envisage comme une "première certification AWS". Le DEA-C01 est de niveau associé. Il suppose que vous connaissez déjà les fondamentaux d'AWS — IAM, VPC, S3, Lambda — au niveau CLF-C02. S'y lancer à froid est difficile. Passez d'abord le CLF-C02 si vous n'avez pas le vocabulaire, ou le SAA-C03 si vous voulez une base plus large.
Marché de l'emploi et salaire
La rémunération en ingénierie des données a été l'une des plus dynamiques du marché des données entre 2024 et 2026. Les données de levels.fyi pour les rôles d'"Ingénieur de données" placent la rémunération de base aux États-Unis entre 115 000 et 185 000 $ pour les niveaux intermédiaires, les rôles seniors atteignant 160 000 à 230 000 $ de base dans les grandes métropoles technologiques. La rémunération totale dans les grandes entreprises technologiques (ingénieurs de données Amazon L5/L6, ingénieurs de données Meta E5/E6) dépasse régulièrement les 300 000 $.
Les données de mai 2024 du BLS OEWS (Bureau of Labor Statistics Occupational Employment Statistics) américain classent les ingénieurs de données sous la catégorie "Administrateurs et architectes de bases de données" (15-1245), avec une médiane d'environ 103 000 $ et un 90e percentile d'environ 164 000 $. Cela sous-estime spécifiquement l'ingénieur de données AWS car le BLS regroupe les rôles d'administrateurs de bases de données traditionnels.
Le DEA-C01 est trop récent pour disposer de données significatives sur les salaires. De manière anecdotique, les titulaires rapportent de modestes améliorations dans le processus d'entretien (plus de recruteurs les contactent, conversion plus rapide du screening à l'entretien sur site) mais pas de différence de rémunération constante par rapport aux ingénieurs de données non certifiés ayant une expérience similaire. La certification n'a que quatorze mois en avril 2026 ; il faudra encore un an ou deux avant qu'elle n'apparaisse clairement dans les données de rémunération.
La valeur professionnelle de la certification est davantage liée à la clarté du rôle qu'au salaire. Elle indique que vous construisez spécifiquement des pipelines de données, ce qui vous aide à être filtré vers les bonnes offres d'emploi au lieu de postuler largement avec le SAA-C03 et d'être associé à des rôles d'architecte que vous ne souhaitez pas.
Temps d'étude et préparation
Fenêtre de certification AWS de niveau associé standard : 80 à 150 heures. Le DEA-C01 tend spécifiquement vers le haut de cette fourchette car la surface des services est vaste et plusieurs services (Glue, Lake Formation, EMR Serverless) sont suffisamment complexes opérationnellement pour que la lecture seule ne suffise pas — il faut les utiliser.
Arc de préparation suggéré :
- Semaines 1 à 3 : Le plan d'apprentissage Data Engineer d'AWS Skill Builder (couverture gratuite décente), plus la lecture de la documentation AWS Glue, Athena et Redshift. Ne sautez pas la documentation. L'examen pose des questions spécifiques sur les paramètres des jobs Glue et les clés de distribution Redshift qui sont documentées mais pas toujours couvertes dans les préparations tierces.
- Semaines 4 à 6 : Pratique. Construisez un pipeline de bout en bout. Ingestez des données d'un flux Kinesis vers S3 via Firehose, explorez-les avec Glue, interrogez-les avec Athena, transformez-les avec un job ETL Glue, chargez-les dans Redshift. Même à petite échelle, faire cela une fois vous en apprend plus que de le lire trois fois.
- Semaines 7 à 8 : Pratique de scénarios. Parcourez la banque de questions DEA-C01 sur CertLabPro pour une pratique d'examen chronométrée. Visez deux scores de pratique consécutifs de 80 % ou plus avant de planifier l'examen.
En résumé
Le DEA-C01 est une certification de niche servant un créneau réel et en croissance. Si vous êtes déjà un ingénieur de données ou souhaitez le devenir, passez-le. Si vous n'êtes pas encore sûr de vouloir vous spécialiser dans l'ingénierie des données, passez d'abord le SAA-C03 — il est plus reconnu, plus général, et vous pourrez revenir au DEA-C01 plus tard si la spécialisation a du sens.
La certification est trop récente pour des affirmations salariales fiables, et quiconque vous dit qu'elle ajoutera 20 000 $ à votre rémunération fait des suppositions. L'argument honnête est le suivant : c'est un titre de compétence valide et approuvé par AWS pour un rôle qui recrute fortement jusqu'en 2026. C'est suffisant.