AWS Certified Data Engineer Associate
275問の練習問題
最終確認:April 2026
学習のための個人ノートとリソースリンク
認定でフィルター
AWS Certified Data Engineer Associate (DEA-C01) は、廃止された Data Analytics Specialty の後継として、実践者向けの資格として2024年3月に開始されました。これは、AWS上でのデータパイプラインと分析ワークロードの設計、構築、運用、セキュリティ確保の能力を検証します。これには、取り込み、変換、ストレージ、オーケストレーション、ガバナンスが含まれます。この試験は、AWS中心のスタックで働くデータエンジニア、アナリティクスエンジニア、ETL開発者を対象としています。Glue、Lambda、Kinesis Data Streams / Firehose、Managed Kafka (MSK)、S3データレイク、Lake Formation、Athena、Redshift、EMRに重点が置かれています。コストを意識した取り込みの選択、ファイル形式とパーティショニング戦略、パイプラインの信頼性に関するシナリオベースの質問が出題されます。DEA-C01は概念的(ラボなし)ですが、実践的なパイプライン経験があることを前提としています。
34%を占める最大のドメイン。Kinesis Data Streams と Firehose と MSK の選択、Glue ETLジョブとDataBrew、軽量なETLにはLambda、SaaSソースにはAppFlow。よくあるつまずきポイント:レイテンシと順序の制約の下で適切なインジェストサービスを選択すること。
S3データレイクの設計、ファイル形式(Parquet、ORC、Avro)、パーティショニング、Lake Formationガバナンス、Redshiftアーキテクチャ(RA3、Serverless)、運用ワークロード向けDynamoDB。実践的なストレージトレードオフをテストします。
Step Functions、Glue Workflows、MWAA (Managed Airflow)、EventBridgeによるワークフローオーケストレーション。データジョブのCloudWatchモニタリング、リトライ、アラート。見落とされがちな点:よりシンプルなStep Functionsと比較してMWAAが正当化される場合。
Lake Formationのアクセス許可、行/列レベルセキュリティによるきめ細かなアクセス、保存時の暗号化のためのKMS、クロスアカウントデータ共有のためのIAMパターン、PII検出(Macie)。比重は小さい(18%)が、密度の高い問題が出題されます。
試験で出会うサービスと、それぞれが重要な理由。
マネージド型 Spark/Python ランタイム、スキーマ検出用のクローラ、Glue Data Catalog、ローコード変換用の Glue DataBrew を備えたサーバーレス ETL プラットフォームです。
試験に出題される理由: Glue はデータ取り込みと変換 (Data Ingestion and Transformation) における主要サービスであり、ジョブブックマーク、ダイナミックフレーム、パーティショニング戦略、DataBrew と Glue Studio のトレードオフに関する質問が予想されます。
AWS データレイクの基盤となるオブジェクトストレージで、ランディングゾーン、生データ層/キュレーションデータ層/消費データ層、あらゆるダウンストリーム分析サービスのソースとして機能します。
試験に出題される理由: DEA-C01 のあらゆるストレージおよび取り込みシナリオで S3 が基盤として想定されており、ストレージクラス、ライフサイクル、Intelligent-Tiering、パーティションレイアウトがデータストア管理 (Data Store Management) の質問のポイントとなります。
カラムナー MPP ストレージ、RA3 分離型コンピュート/ストレージ、S3 上の Redshift Spectrum、Aurora からの zero-ETL 取り込みを備えたマネージド型クラウドデータウェアハウスです。
試験に出題される理由: データストア管理 (Data Store Management) の質問では、Redshift (データウェアハウス) と Athena/Glue/Lake Formation (レイクハウス) が繰り返し比較され、分散キー、ソートキー、ワークロード管理が焦点となります。
EMR on EC2、EMR Serverless、EMR on EKS をサポートし、大規模なバッチおよびストリーミングジョブを実行するマネージド型 Hadoop / Spark / Hive / Presto / Flink ランタイムです。
試験に出題される理由: Glue の規模を超える、または Spark/Hudi/Iceberg 統合を必要とするデータ取り込みと変換 (Data Ingestion and Transformation) シナリオでは、EMR が解答となります。
クリックストリーム、IoT、アプリケーション、ログイベントを大規模にリアルタイムで取り込むストリーミングサービスで、シャードまたはオンデマンドのキャパシティ、保持期間内のリプレイをサポートします。
試験に出題される理由: データ取り込みと変換 (Data Ingestion and Transformation) ではストリーミング取り込み設計がテストされ、Kinesis Data Streams は Firehose、Lambda、Flink にデータを供給する低レイテンシパイプライン向けの AWS ネイティブなソースです。
レコードをバッチ処理、圧縮し、S3、Redshift、OpenSearch、Splunk、または HTTP エンドポイントに配信するマネージド型ストリーミング配信サービスで、Lambda によるオプションの変換も可能です。
試験に出題される理由: Firehose は、コンシューマーコードを記述せずに、マネージド型でほぼリアルタイムにシンクへデータを配信する要求に対する、データ取り込み (Data Ingestion) の典型的な解答です。
Glue Data Catalog を使用して S3 (およびフェデレーションされたソース) 上で動作するサーバーレスな対話型 SQL エンジンで、コスト/アクセス制御用のワークグループとクエリごとの料金設定を備えています。
試験に出題される理由: データ運用とサポート (Data Operations and Support) シナリオでは、レイクデータのアドホックな探索や、Lake Formation ガバナンスの背後にあるクエリ層として Athena が使用されます。
完全なオペレーター/センサーサポートを備えた Python DAG としてデータパイプラインを作成、スケジュール、監視するためのマネージド型 Apache Airflow サービスです。
試験に出題される理由: パイプラインオーケストレーションに関するデータ運用とサポート (Data Operations and Support) の質問では、MWAA (Airflow ネイティブ、コード優先) と Step Functions (ステートマシン) が区別され、複雑なクロスサービス DAG には MWAA が選択されます。
Glue Data Catalog 上に構築されたきめ細かなアクセスコントロール層で、Athena、Redshift Spectrum、EMR、Glue にわたる行、列、タグベースのアクセス許可を提供します。
試験に出題される理由: データセキュリティとガバナンス (Data Security and Governance) では、Lake Formation がレイクデータに対する行/列レベルのセキュリティを実現するための AWS ネイティブな解答としてテストされ、S3 への直接 IAM パターンを置き換えます。
シングルミリ秒のレイテンシ、オンデマンドまたはプロビジョニングされたキャパシティ、CDC 用の Streams、S3 への zero-ETL エクスポートを備えたサーバーレスなキーバリュー/ドキュメント NoSQL データベースです。
試験に出題される理由: データストア管理 (Data Store Management) では、DynamoDB (オペレーショナル NoSQL) がリレーショナルデータベースおよびデータウェアハウスのオプションと比較され、DynamoDB Streams はレイクへの CDC を可能にします。
マネージド型リレーショナルデータベース (PostgreSQL, MySQL, Oracle, SQL Server, MariaDB) と Aurora で、分析用の Redshift への zero-ETL レプリケーションを含みます。
試験に出題される理由: データストア管理 (Data Store Management) とデータ取り込み (Data Ingestion) の両方で、RDS/Aurora が zero-ETL、DMS、または論理レプリケーションを通じてデータウェアハウスにデータを供給する運用ソースとして参照されます。
異種データベース間 (Oracle/SQL Server から Aurora/Redshift、オンプレミスから AWS など) でのワンタイムおよび継続的な (CDC) レプリケーションのためのマネージドサービスです。
試験に出題される理由: データ取り込みと変換 (Data Ingestion and Transformation) では、ソースがストリームやファイルではなく運用中の RDBMS である場合の、典型的な移行/CDC の解答として DMS がテストされます。
Glue、EMR、Lambda、Athena、SageMaker、DynamoDB とのネイティブ統合を備えたサーバーレスワークフローオーケストレーターで、パイプラインを標準またはエクスプレスのステートマシンとしてモデル化します。
試験に出題される理由: データ運用とサポート (Data Operations and Support) の質問では、Step Functions (ステートマシン、サブ秒/長時間実行) と MWAA (Airflow DAG) が区別され、イベント駆動型で AWS ネイティブなフローには Step Functions が有利です。
AWS サービスイベント、パートナーイベント、カスタムイベントを、コンテンツベースのフィルタリングとスケジュール機能を用いてターゲット (Lambda、Step Functions、Firehose、SQS) にルーティングするサーバーレスイベントバスです。
試験に出題される理由: データ運用とサポート (Data Operations and Support) では、スケジュールまたはデータ到着イベントに基づいてパイプラインをトリガーしたり、チーム全体にシグナルをファンアウトしたりするために EventBridge を使用します。
転送中のレコード変換 (Firehose / Kinesis)、軽量な ETL Glue、S3 イベント駆動型前処理、パイプラインのカスタムロジックに利用されるサーバーレスコンピュートです。
試験に出題される理由: データ取り込みと変換 (Data Ingestion and Transformation) では、Firehose のデータ変換ユースケースや、Glue や EMR を正当化しないイベント駆動型ステップの連結に Lambda が想定されます。
検索、ログ分析、オブザーバビリティのためのマネージド型 OpenSearch (およびレガシー Elasticsearch) で、可変キャパシティワークロード向けの OpenSearch Serverless を含みます。
試験に出題される理由: データストア管理 (Data Store Management) とデータ運用 (Data Operations) では、OpenSearch がログ分析のターゲットとして、また検索可能なテレメトリのための Firehose / Kinesis の送信先として挙げられます。
SPICE インメモリエンジン、ML インサイト、埋め込み分析、Q (自然言語) を備え、Redshift、Athena、RDS、S3 ソースをクエリできるサーバーレス BI サービスです。
試験に出題される理由: データ運用とサポート (Data Operations and Support) のビジネスユーザーへの分析提供に関する質問では、QuickSight がレイク/ウェアハウス上の AWS ネイティブな消費層として挙げられます。
アカウント全体のアクセスコントロール: ユーザー、ロール、ポリシー、フェデレーション、そしてすべての Glue ジョブ、S3 オブジェクト、Redshift クエリ、パイプラインステップに対する最小権限のアクセス許可を提供します。
試験に出題される理由: データセキュリティとガバナンス (Data Security and Governance) は IAM に基づいており、Glue/EMR の実行ロール、クロスアカウントデータ共有、リソースベースのバケットポリシーが繰り返し出題される質問です。
S3 オブジェクト、Redshift クラスター、RDS ボリューム、Kinesis レコード、Glue Data Catalog メタデータを保存時に暗号化するために使用される暗号化キーのマネージドな作成と制御を提供します。
試験に出題される理由: データセキュリティとガバナンス (Data Security and Governance) では、あらゆるストレージおよびパイプラインサービスにわたる、監査可能なキーローテーションを備えた保存時暗号化のために、KMS カスタマーマネージドキー (CMK) が想定されます。
すべての API コールのアカウント全体の監査ログ: 誰が Glue ジョブを起動したか、誰が Redshift をクエリしたか、誰が Lake Formation のアクセス許可を変更したか、誰が S3 からデータをエクスポートしたかなどを記録します。
試験に出題される理由: データセキュリティとガバナンス (Data Security and Governance) のコンプライアンスシナリオでは、監査、フォレンジック調査、規制上の証拠に必要となる不変の記録として CloudTrail が挙げられます。
$105k–$150k–$215k USD 年収
この範囲は、AWSの習熟度が求められる米国拠点の中級から上級データエンジニアリング職を対象としています。FAANGや大規模なデータ集約型企業では、シニアレベルで260kドルTCを超えることも珍しくありません。エントリーレベルの職種や沿岸部以外の市場では低くなる傾向があります。DEA-C01は信頼できるシグナルですが、採用の唯一の要因となることは稀です。
出典: levels.fyi 2025–2026 データエンジニアリング職、米国労働統計局 OEWS 2024年5月 (15-1252 software developers, 15-2051 data scientists)。数値は概算であり、実際の報酬は職務、地域、経験によって異なります。
企業がクラウドデータレイク、レイクハウスアーキテクチャ、分析プラットフォームの構築を継続したため、データエンジニアリングの採用は2024年から2026年にかけて堅調に推移しました。DEA-C01は、Snowflake、Databricks、またはdbtの経験と並んで、信頼できるAWS固有のシグナルとして機能します。AWS中心のデータ企業のリクルーターは、SQL、Python、Sparkの流暢さと共に、DEA-C01を迅速なフィルタとして使用します。Solutions Architect Associate (SAA-C03)、Machine Learning Engineer Associate (MLA-C01)、およびAirflowやdbtのようなプロバイダーニュートラルなツールと自然に組み合わせることができます。この認定資格だけでは、スタッフデータエンジニアやプリンシパルデータプラットフォームの役割の候補者として適格とはなりません。これらの役割には、実績のある大規模なパイプラインの所有経験と、より広範なシステム設計経験が求められます。
正式な前提条件はありません。AWSは、一般的なデータエンジニアリングの経験が少なくとも2〜3年、AWSデータサービスの実践的な経験が少なくとも1年あることを推奨しています。
ほとんどの候補者は、SAA-C03(アーキテクチャの基礎)の後にDEA-C01に挑戦するか、強力なSpark/SQL/Pythonのバックグラウンドから直接挑戦します。AWSの経験がないキャリアチェンジャーにとっては、CLF-C02が良いウォーミングアップになります。最も効率的な個人プロジェクトの準備は、Kinesis Firehose → S3(Parquet、パーティション化)→ Glue catalog → AthenaおよびRedshift Serverlessというエンドツーエンドのパイプラインを作成することです。オーケストレーションにはStep FunctionsまたはGlue Workflowsを、ガバナンスにはLake Formationを使用します。AWS以外のデータバックグラウンド(例:オンプレミスのHadoopや純粋なSnowflake)を持つ候補者は、Glue、Lake Formation、Kinesisファミリーにより多くの時間をかけるべきです。
DEA-C01はアソシエイトレベルと評価されており、SAA-C03と比較してサービス範囲がより限定的である点で難易度が同等です。以前にデータエンジニアリングの経験がある候補者は8〜12週間で70〜110時間の学習時間を、経験のない候補者は120〜160時間の学習時間を計画してください。試験は65問の採点対象問題で130分間 — 多肢選択式と多肢応答式で、ラボはありません。
よくあるつまずきポイントとしては、Kinesis Data Streams(カスタムコンシューマ、順序付け、保持)とFirehose(マネージドデリバリー、変換)、MSK(Kafka互換)を区別すること。特定のパイプラインに適したオーケストレーター(Step Functions、Glue Workflows、MWAA、EventBridge Scheduler)を知ること。そして、Lake Formationのアクセス許可継承のエッジケースがあります。ファイル形式とパーティショニングに関する計算(圧縮率、Parquetの列プルーニング)が頻繁に出題されます。
初回一般提供開始。ベータ試験は2023年後半に実施されました。エンジニアリングに焦点を当てた候補者向けに、廃止された Data Analytics Specialty (DAS-C01) に代わるものです。2026年4月現在の現行バージョン。
DEA-C01 (AWS Certified Data Engineer Associate) は、実践的な実務経験とベストプラクティスに関するしっかりとした理解を期待される、中程度の難易度の試験 Associateレベルの試験です。ほとんどの受験者は、アソシエイトレベルの試験に6〜12週間かけて80〜150時間の学習を必要とします。 練習試験で合格基準を安定して上回るスコアを獲得している受験者のほとんどは、初回で合格しています。
ほとんどの受験者は、アソシエイトレベルの試験に6〜12週間かけて80〜150時間の学習を必要とします。 合格までの時間は、これまでの経験によって大きく異なります。基礎となるテクノロジーでの実践的な本番経験を持つエンジニアは通常、より少ない時間で済みますが、プラットフォームに初めて触れる受験者は、この範囲の上限を目安に計画を立てる必要があります。
DEA-C01は、AWSエコシステムで認められた資格であり、雇用主、リクルーター、クライアントに検証済みの知識を示します。あなたにとって時間と費用をかける価値があるかどうかは、あなたの役割と目標によります。通常、AWSを日常的に扱っている、またはそのような役割に就きたいと考えているクラウドエンジニア、アーキテクト、コンサルタントにとって最も報われる傾向があります。
DEA-C01の合格点は720 / 1000です。試験には65問の問題が含まれており、所要時間は2 時間 10 分です。
DEA-C01試験の受験料は$150 USDです。受験料はAWSによって設定されており、地域によって異なる場合があります。予約する前に、常にAWSの公式認定ページで現在の価格を確認してください。
AWS認定は3年間有効です。失効前に、同じ試験の現在のバージョンに合格するか、同じパスの上位レベルの試験に合格することで再認定されます。
はい。試験はオンライン(プロバイダーのセキュアブラウザを介して監督され、ほとんどの地域で24時間年中無休で利用可能)または営業時間内のピアソンVUE試験センターで対面で受験できます。どちらの形式も同じ問題、時間制限、合格点を使用します。
CertLabProでは、DEA-C01の練習問題バンクで15の学習モードを提供しています。試験シミュレーションモードは、実際の試験を反映しており、2 時間 10 分で65問、合格基準は720 / 1000と同じです。ブラウズモードでは、すべてのQ&Aを静的に読むことができます。