AWS Certified Data Engineer Associate
275 Übungsfragen
Zuletzt überprüft: April 2026
Persönliche Notizen und Ressourcenlinks für Ihre Lernreise
Nach Zertifizierung Filtern
Der AWS Certified Data Engineer Associate (DEA-C01) wurde im März 2024 als praxisorientierter Nachfolger der eingestellten Data Analytics Specialty eingeführt. Er bestätigt die Fähigkeit, Datenpipelines und Analyse-Workloads auf AWS zu entwerfen, zu bauen, zu betreiben und zu sichern – einschließlich Ingestion, Transformation, Speicherung, Orchestrierung und Governance. Die Prüfung richtet sich an praktizierende Data Engineers, Analytics Engineers und ETL-Entwickler auf AWS-zentrierten Stacks. Starker Fokus auf Glue, Lambda, Kinesis Data Streams / Firehose, Managed Kafka (MSK), S3 Data Lakes, Lake Formation, Athena, Redshift und EMR. Erwarten Sie szenariobasierte Fragen zu kostenbewussten Ingestion-Entscheidungen, Dateiformat- und Partitionierungsstrategien sowie zur Zuverlässigkeit von Pipelines. DEA-C01 ist konzeptionell (keine Labs), setzt jedoch praktische Pipeline-Erfahrung voraus.
Das größte Themengebiet mit 34 %. Auswahl zwischen Kinesis Data Streams, Firehose und MSK, Glue ETL-Jobs und DataBrew, Lambda für leichtgewichtige ETL und AppFlow für SaaS-Quellen. Häufige Stolperfalle: die Wahl des richtigen Ingestion-Dienstes unter Berücksichtigung von Latenz- und Reihenfolge-Einschränkungen.
S3 Data Lake-Design, Dateiformate (Parquet, ORC, Avro), Partitionierung, Lake Formation-Governance, Redshift-Architektur (RA3, Serverless) und DynamoDB für operationale Workloads. Testet praktische Kompromisse bei der Speicherung.
Workflow-Orchestrierung mit Step Functions, Glue Workflows, MWAA (Managed Airflow) und EventBridge. CloudWatch-Monitoring von Datenjobs, Wiederholungsversuchen und Alarmierungen. Oft übersehen: wann MWAA gegenüber einfacheren Step Functions gerechtfertigt ist.
Lake Formation-Berechtigungen, fein abgestufter Zugriff über Zeilen-/Spalten-Level-Sicherheit, KMS für Verschlüsselung ruhender Daten, IAM-Muster für kontoübergreifende Datenfreigabe und PII-Erkennung (Macie). Geringeres Gewicht (18 %), aber Fragen mit hoher Dichte.
Services, die Sie in der Prüfung antreffen, und warum jeder davon wichtig ist.
Serverlose ETL-Plattform mit verwalteter Spark/Python-Laufzeit, Crawlern für die Schemaerkennung, dem Glue Data Catalog und Glue DataBrew für Low-Code-Transformation.
Warum er in der Prüfung steht: Glue ist der wichtigste Dienst in Domäne Datenaufnahme und -transformation – erwarten Sie Fragen zu Job-Bookmarks, dynamischen Frames, Partitionierungsstrategien und Abwägungen zwischen DataBrew und Glue Studio.
Objektspeicher, der als Grundlage für den AWS-Data Lake dient – Landing Zone, Roh-/kurierte/Nutzungsschichten und Quelle für jeden nachgelagerten Analyse-Dienst.
Warum er in der Prüfung steht: Jedes DEA-C01 Speicher- und Aufnahmeszenario setzt S3 als Substrat voraus; Speicherklassen, Lebenszyklus, Intelligent-Tiering und Partitionslayout bestimmen Fragen zur Datenspeicherverwaltung.
Verwaltetes Cloud-Data-Warehouse mit Spalten-MPP-Speicher, RA3-separierter Compute-/Speicherarchitektur, Redshift Spectrum über S3 und Zero-ETL-Aufnahme aus Aurora.
Warum er in der Prüfung steht: Fragen zur Datenspeicherverwaltung stellen Redshift (Warehouse) wiederholt Athena/Glue/Lake Formation (Lakehouse) gegenüber – Verteilungsschlüssel, Sortierschlüssel und Workload-Management sind hier relevant.
Verwaltete Hadoop-/Spark-/Hive-/Presto-/Flink-Laufzeit, die EMR auf EC2, EMR Serverless und EMR auf EKS für große Batch- und Streaming-Jobs unterstützt.
Warum er in der Prüfung steht: Szenarien zur Datenaufnahme und -transformation, die über die Skalierung von Glue hinausgehen oder eine Spark/Hudi/Iceberg-Integration erfordern, nennen EMR als Lösung.
Echtzeit-Streaming-Dienst für die skalierbare Aufnahme von Clickstream-, IoT-, Anwendungs- und Log-Ereignissen, mit Shard- oder On-Demand-Kapazität und Wiederholung innerhalb des Aufbewahrungsfensters.
Warum er in der Prüfung steht: Die Datenaufnahme und -transformation testet das Design von Streaming-Aufnahmen – Kinesis Data Streams ist die AWS-eigene Quelle für Low-Latency-Pipelines, die Firehose, Lambda oder Flink speisen.
Verwalteter Streaming-Lieferdienst, der Datensätze stapelt, komprimiert und in S3, Redshift, OpenSearch, Splunk oder HTTP-Endpunkte mit optionaler Lambda-Transformation liefert.
Warum er in der Prüfung steht: Firehose ist die kanonische Antwort für die Datenaufnahme, wenn eine Frage nach verwalteter, nahezu Echtzeit-Lieferung an ein Ziel fragt, ohne Konsumentencode schreiben zu müssen.
Serverlose interaktive SQL-Engine über S3 (und föderierte Quellen), die den Glue Data Catalog nutzt, mit Workgroups für Kosten-/Zugriffskontrolle und Pay-per-Query-Abrechnung.
Warum er in der Prüfung steht: Szenarien zum Datenbetrieb und -support verwenden Athena für die Ad-hoc-Exploration von Lake-Daten und als Abfrageschicht hinter der Lake Formation-Governance.
Verwalteter Apache Airflow-Dienst zum Erstellen, Planen und Überwachen von Datenpipelines als Python-DAGs mit vollständiger Operator-/Sensorunterstützung.
Warum er in der Prüfung steht: Fragen zum Datenbetrieb und -support zur Pipeline-Orchestrierung unterscheiden MWAA (Airflow-nativ, code-first) von Step Functions (State-Machine) – wählen Sie MWAA für komplexe dienstübergreifende DAGs.
Feingranulare Zugriffskontrollschicht über dem Glue Data Catalog, die zeilen-, spalten- und tag-basierte Berechtigungen über Athena, Redshift Spectrum, EMR und Glue hinweg bereitstellt.
Warum er in der Prüfung steht: Datensicherheit und -governance testet Lake Formation als AWS-eigene Antwort für zeilen-/spaltenbasierte Sicherheit auf Lake-Daten, die direkte IAM-on-S3-Muster ersetzt.
Serverlose Schlüssel-Wert-/Dokument-NoSQL-Datenbank mit einstelliger Millisekunden-Latenz, On-Demand- oder bereitgestellter Kapazität, Streams für CDC und Zero-ETL-Export nach S3.
Warum er in der Prüfung steht: Die Datenspeicherverwaltung vergleicht DynamoDB (operatives NoSQL) mit relationalen und Warehouse-Optionen; DynamoDB Streams ermöglichen CDC in den Lake.
Verwaltete relationale Datenbanken (PostgreSQL, MySQL, Oracle, SQL Server, MariaDB) plus Aurora – einschließlich Zero-ETL-Replikation nach Redshift für Analysen.
Warum er in der Prüfung steht: Datenspeicherverwaltung und Datenaufnahme verweisen beide auf RDS/Aurora als operationelle Quelle, die das Warehouse über Zero-ETL, DMS oder logische Replikation speist.
Verwalteter Dienst für einmalige und kontinuierliche (CDC) Replikation zwischen heterogenen Datenbanken – Oracle/SQL Server nach Aurora/Redshift, On-Premise nach AWS.
Warum er in der Prüfung steht: Die Datenaufnahme und -transformation testet DMS als kanonische Migrations-/CDC-Antwort, wenn die Quelle ein operatives RDBMS und kein Stream oder eine Datei ist.
Serverloser Workflow-Orchestrator mit nativen Integrationen für Glue, EMR, Lambda, Athena, SageMaker und DynamoDB, der Pipelines als Standard- oder Express-Zustandsautomaten modelliert.
Warum er in der Prüfung steht: Fragen zum Datenbetrieb und -support unterscheiden Step Functions (State-Machine, Sub-Sekunden-/langlaufend) von MWAA (Airflow DAGs) – Step Functions gewinnt für ereignisgesteuerte, AWS-eigene Flows.
Serverloser Event-Bus, der AWS-Service-Ereignisse, Partner-Ereignisse und benutzerdefinierte Ereignisse mit inhaltsbasierten Filtern und Zeitplänen an Ziele (Lambda, Step Functions, Firehose, SQS) weiterleitet.
Warum er in der Prüfung steht: Der Datenbetrieb und -support verwendet EventBridge, um Pipelines nach Zeitplan oder bei Datenankunftsereignissen auszulösen und Signale teamübergreifend zu verteilen.
Serverloses Compute, das für In-Flight-Datensatztransformation (Firehose / Kinesis), leichtgewichtiges ETL-Glue, S3-ereignisgesteuerte Vorverarbeitung und benutzerdefinierte Pipelogik verwendet wird.
Warum er in der Prüfung steht: Die Datenaufnahme und -transformation erwartet Lambda für Firehose-Datentransformations-Anwendungsfälle und zum Verknüpfen ereignisgesteuerter Schritte, die Glue oder EMR nicht rechtfertigen.
Verwalteter OpenSearch-Dienst (und früheres Elasticsearch) für Suche, Log-Analyse und Observability – einschließlich OpenSearch Serverless für Workloads mit variabler Kapazität.
Warum er in der Prüfung steht: Datenspeicherverwaltung und Datenbetrieb nennen OpenSearch als Ziel für Log-Analysen und als Firehose-/Kinesis-Ziel für durchsuchbare Telemetrie.
Serverloser BI-Dienst mit SPICE-In-Memory-Engine, ML-Insights, eingebetteter Analyse und Q (natürliche Sprache) zum Abfragen von Redshift, Athena, RDS und S3-Quellen.
Warum er in der Prüfung steht: Fragen zum Datenbetrieb und -support zur Bereitstellung von Analysen für Geschäftsbenutzer nennen QuickSight als AWS-eigene Konsumschicht über dem Lake/Warehouse.
Kontoübergreifende Zugriffskontrolle: Benutzer, Rollen, Richtlinien, Föderation und Least-Privilege-Berechtigungen für jeden Glue-Job, S3-Objekt, Redshift-Abfrage und Pipeline-Schritt.
Warum er in der Prüfung steht: Datensicherheit und -governance basiert auf IAM – Ausführungsrollen für Glue/EMR, kontoübergreifende Datenfreigabe und ressourcenbasierte Bucket-Richtlinien sind wiederkehrende Fragen.
Verwaltete Erstellung und Kontrolle kryptografischer Schlüssel zur Verschlüsselung von S3-Objekten, Redshift-Clustern, RDS-Volumes, Kinesis-Datensätzen und Glue Data Catalog-Metadaten im Ruhezustand.
Warum er in der Prüfung steht: Datensicherheit und -governance erwartet KMS Customer-Managed Keys (CMKs) für die Verschlüsselung im Ruhezustand mit auditierbarer Schlüsselrotation über alle Speicher- und Pipeline-Dienste hinweg.
Kontoübergreifendes Audit-Log jedes API-Aufrufs – wer einen Glue-Job gestartet, Redshift abgefragt, Lake Formation-Berechtigungen geändert oder Daten aus S3 exportiert hat.
Warum er in der Prüfung steht: Compliance-Szenarien der Datensicherheit und -governance nennen CloudTrail als unveränderliches Protokoll, das für Audit, forensische Untersuchung und regulatorische Nachweise benötigt wird.
$105k–$150k–$215k USD jährlich
Die Spanne umfasst US-basierte Data-Engineering-Positionen im mittleren bis Senior-Bereich, für die AWS-Kenntnisse erforderlich sind. FAANG und große datenintensive Unternehmen überschreiten auf Senior-Levels häufig 260.000 US-Dollar Gesamtkompensation. Einstiegspositionen und Märkte außerhalb der Küstenregionen liegen tendenziell niedriger. DEA-C01 ist ein glaubwürdiges Signal, aber selten der einzige Einstellungsfaktor.
Quelle: levels.fyi 2025–2026 Data Engineering Rollen, U.S. BLS OEWS Mai 2024 (15-1252 software developers, 15-2051 data scientists). Die Zahlen sind ungefähr; die tatsächliche Vergütung hängt von der Rolle, der Region und der Erfahrung ab.
Die Einstellung im Bereich Data Engineering blieb von 2024 bis 2026 stark, da Unternehmen weiterhin Cloud Data Lakes, Lakehouse-Architekturen und Analyseplattformen aufbauten. DEA-C01 dient als glaubwürdiges AWS-spezifisches Signal neben Erfahrungen mit Snowflake, Databricks oder dbt. Recruiter in AWS-zentrierten Datenunternehmen nutzen es als schnellen Filter zusammen mit SQL-, Python- und Spark-Kenntnissen. Es passt natürlich zu den Zertifizierungen Solutions Architect Associate (SAA-C03), Machine Learning Engineer Associate (MLA-C01) und anbieterneutralen Tools wie Airflow und dbt. Das Zertifikat allein qualifiziert Kandidaten NICHT für Staff Data Engineer- oder Principal Data Platform-Rollen – diese erfordern nachweisliche Erfahrung in der Leitung großer Pipelines und umfassendere Systemdesign-Erfahrung.
Es gibt keine formalen Voraussetzungen. AWS empfiehlt mindestens 2–3 Jahre allgemeine Data-Engineering-Erfahrung und mindestens ein Jahr praktische Erfahrung mit AWS-Datendiensten.
Die meisten Kandidaten nähern sich DEA-C01 nach SAA-C03 (architektonische Grundlagen) oder direkt aus einem starken Spark/SQL/Python-Hintergrund. CLF-C02 ist ein nützlicher Einstieg für Quereinsteiger ohne AWS-Kenntnisse. Die effizienteste Vorbereitung durch ein persönliches Projekt ist eine End-to-End-Pipeline: Kinesis Firehose → S3 (Parquet, partitioniert) → Glue-Katalog → Athena und Redshift Serverless, mit Step Functions oder Glue Workflows zur Orchestrierung und Lake Formation für die Governance. Kandidaten mit Datenhintergrund außerhalb von AWS (z.B. On-Premises Hadoop oder reines Snowflake) sollten zusätzliche Zeit für Glue, Lake Formation und die Kinesis-Familie einplanen.
DEA-C01 ist als Associate eingestuft und in seinem Schwierigkeitsgrad vergleichbar mit SAA-C03, hat jedoch eine stärker fokussierte Service-Oberfläche. Kandidaten mit vorheriger Data-Engineering-Erfahrung sollten 70–110 Stunden über 8–12 Wochen einplanen; für diejenigen ohne sind es 120–160 Stunden. Die Prüfung umfasst 65 bewertete Fragen in 130 Minuten – Multiple-Choice und Multiple-Response, keine Labs.
Häufige Stolpersteine sind die Unterscheidung von Kinesis Data Streams (benutzerdefinierte Consumer, Reihenfolge, Aufbewahrung) von Firehose (verwaltete Bereitstellung, Transformationen) und MSK (Kafka-kompatibel); zu wissen, welcher Orchestrator (Step Functions, Glue Workflows, MWAA, EventBridge Scheduler) zu einer bestimmten Pipeline passt; und Grenzfälle bei der Vererbung von Lake Formation-Berechtigungen. Dateiformat- und Partitionierungsmathematik (Kompressionsraten, Parquet Column Pruning) taucht regelmäßig auf.
Erste allgemeine Verfügbarkeit. Die Beta-Prüfung fand Ende 2023 statt. Ersetzt die eingestellte Data Analytics Specialty (DAS-C01) für auf Engineering fokussierte Kandidaten. Aktuelle Version Stand April 2026.
DEA-C01 (AWS Certified Data Engineer Associate) ist eine eine mittelschwere Prüfung, die praktische Erfahrung sowie ein solides Verständnis der Best Practices erwartet Associate-Level-Prüfung. Die meisten Kandidaten benötigen 80–150 Stunden Lernzeit, verteilt über 6–12 Wochen, für Prüfungen auf Associate-Niveau. Die meisten Kandidaten, die bei Übungsprüfungen konstant über der Bestehensschwelle liegen, bestehen beim ersten Versuch.
Die meisten Kandidaten benötigen 80–150 Stunden Lernzeit, verteilt über 6–12 Wochen, für Prüfungen auf Associate-Niveau. Die benötigte Zeit bis zum Bestehen variiert stark je nach Vorerfahrung. Ingenieure mit praktischer Produktionserfahrung in der zugrunde liegenden Technologie benötigen in der Regel weniger; Kandidaten, die neu auf der Plattform sind, sollten sich am oberen Ende dieses Bereichs orientieren.
DEA-C01 ist ein anerkanntes Zeugnis im AWS-Ökosystem und signalisiert Arbeitgebern, Personalvermittlern und Kunden validiertes Wissen. Ob es sich für Sie lohnt, hängt von Ihrer Rolle und Ihren Zielen ab – es zahlt sich am meisten für Cloud-Ingenieure, Architekten und Berater aus, die täglich mit AWS arbeiten oder in solche Rollen wechseln möchten.
Die Bestehensgrenze für DEA-C01 beträgt 720 / 1000. Die Prüfung enthält 65 Fragen und dauert 2 Std 10 Min.
Die Prüfungsgebühr für DEA-C01 beträgt $150 USD. Die Gebühren werden von AWS festgelegt und können je nach Region variieren; bestätigen Sie immer den aktuellen Preis auf der offiziellen AWS Zertifizierungsseite, bevor Sie buchen.
AWS-Zertifizierungen sind 3 Jahre gültig. Rezertifizieren Sie sich, indem Sie die aktuelle Version derselben Prüfung bestehen oder eine Prüfung auf höherem Niveau im selben Pfad vor Ablauf bestehen.
Ja. Sie können die Prüfung online (über den sicheren Browser des Anbieters, in den meisten Regionen rund um die Uhr verfügbar) oder in einem persönlichen Pearson VUE Testzentrum während der Geschäftszeiten ablegen. Beide Formate verwenden die gleichen Fragen, Zeitlimits und Bestehensgrenzen.
CertLabPro bietet 15 Lernmodi für die Übungsfragenbank für DEA-C01. Der Prüfungssimulationsmodus bildet die echte Prüfung ab: 65 Fragen in 2 Std 10 Min, mit der gleichen Bestehensschwelle von 720 / 1000. Im Browsing-Modus können Sie jede Frage und Antwort statisch lesen.