Google Cloud Professional Data Engineer
225問の練習問題
最終確認:April 2026
学習のための個人ノートとリソースリンク
認定でフィルター
Google Cloud Professional Data Engineer (PDE) は、Google Cloud 上でデータ処理システムを設計、構築、保護、運用する能力を検証します。この試験は、GCP プロフェッショナル資格の中でも特に人気があり、市場で最も高収入の単一データ認証の1つとして常に上位にランクインしています。BigQuery (パーティショニング、クラスタリング、マテリアライズドビュー、BI Engine、BigLake、Omni)、Dataflow (Apache Beam のバッチ処理とストリーミング処理、ウィンドウ処理、ウォーターマーク)、Pub/Sub、Dataproc、Cloud Composer (マネージド Airflow)、Dataform、Dataplex、Datastream、および ML パイプラインのための Vertex AI 統合が深くカバーされます。問題形式はシナリオが多く、コスト、レイテンシ、鮮度、スキーマ進化のトレードオフを同時に考慮できる候補者が報われます。
ソースシステム分析、データウェアハウスとデータレイクとレイクハウスの設計、BigQueryのスキーマモデリング(非正規化、ネスト、ARRAY/STRUCT)、適切なストレージの選択(BigQuery vs. Bigtable vs. Spanner vs. Firestore vs. Cloud SQL)。22%。
25%を占める最大のドメイン。Pub/Sub のパターン、Apache Beam を使用した Dataflow のバッチ処理とストリーミング処理(ウィンドウ処理、トリガー、ウォーターマーク、厳密に1回限りセマンティクス)、Dataproc の Spark ジョブ、Datastream の CDC、Storage Transfer Service。
BigQuery のパーティショニングとクラスタリング、マテリアライズドビュー、BI Engine、BigLake の外部テーブル、テーブルレベルのスナップショットとタイムトラベル、Bigtable のスキーマ設計、Cloud Storage のクラス遷移。20%。
BigQuery SQL(ウィンドウ関数、ARRAY/STRUCT 操作、検索インデックス)、BigQuery ML、Looker セマンティックモデルの基本、Cloud SQL / Spanner / Cloud Storage へのフェデレーションクエリ、Vertex AI 統合。15%。
Cloud Composer の DAG、Dataform のワークフロー、BigQuery のスケジュール済みクエリ、スロット予約とオンデマンド料金、Cloud Monitoring を使用したモニタリング、データセット / テーブル / 列 / 行レベルでの IAM。18%。
試験で出会うサービスと、それぞれが重要な理由。
ストレージとコンピューティングが分離されたサーバーレスなカラム型データウェアハウスで、オンデマンドおよびリザーベーションスロット、ウェアハウス内モデリング用のBigQuery ML、増分集計用のマテリアライズドビューを提供します。
試験に出題される理由: BigQueryはPDEの全ての5つのドメインにおいて主要な分析サーフェスであり、パーティショニング、クラスタリング、スロット予約、およびクエリ最適化が試験の大部分を占めます。
GCPデータレイクの基盤となるオブジェクトストレージで、ランディング/キュレーテッド/コンサンプションゾーン、マルチリージョンおよびデュアルリージョンバケット、ライフサイクルポリシーを提供し、全てのダウンストリーム分析サービスのソースとなります。
試験に出題される理由: あらゆるPDEのストレージと取り込みシナリオでCloud Storageが基盤として想定され、ストレージクラス、保持ポリシー、署名付きURLアクセスパターンが「データの保存」に関する問題を構成します。
オートスケーリングワーカー、Streaming Engine、再利用可能なデプロイ用のFlex Templatesを備えた、統合されたストリーミングおよびバッチパイプライン向けのフルマネージドApache Beamランナーです。
試験に出題される理由: Dataflowは「データの取り込みと処理」における典型的な解答であり、ウィンドウ処理、トリガー、exactly-onceセマンティクス、ストリーミング対バッチのトレードオフに関する問題が全てここに集約されます。
一時的なオートスケーリングを備えたマネージドなSpark、Hadoop、Hive、Presto、Flinkクラスターで、バッチSpark用のDataproc Serverless、共有インフラ用のSpark-on-GKEを提供します。
試験に出題される理由: PDEでは、既存のSpark/Hadoopワークロードの移行先としてDataprocが期待され、一時的対長期実行、オートスケーリングポリシー、Dataproc対Dataflowの選択が「データ処理システムの設計」に登場します。
at-least-once配信、順序キー、デッドレタートピック、コスト最適化されたリージョナルストリーム用のPub/Sub Liteを備えた、非同期取り込み用のグローバル分散メッセージングサービスです。
試験に出題される理由: Pub/Subは「データの取り込みと処理」におけるデフォルトのストリーミング取り込みサーフェスであり、配信セマンティクス、サブスクリプションタイプ、バックログの動作が繰り返し出題される試験トピックです。
BigQuery、Dataflow、Dataproc、および外部システムにまたがるクロスサービスDAGをオーケストレーションするためのマネージドApache Airflowサービスで、Composer 2はGKE Autopilot上で実行されます。
試験に出題される理由: 「データワークロードの維持と自動化」ではDAGパターン、リトライ、SLA監視がテストされ、PDEではよりシンプルなチェーン用のWorkflowsとは対照的に、Composerが指定されたオーケストレーターです。
強整合性、水平スケーリング、SQLを備えたグローバル分散リレーショナルデータベースで、分析パイプラインにデータを供給する運用記録システムとして使用されます。
試験に出題される理由: PDEのストレージに関する問題ではOLTP (Spanner) と OLAP (BigQuery) が区別され、BigQueryからのSpannerフェデレーテッドクエリがCDCパイプラインよりも優れているのはどのような場合かを問われます。
ペタバイト規模で1桁ミリ秒の読み取りを実現し、HBase API互換性を持ち、時系列およびIoTワークロードに最適化されたワイドカラムNoSQLサービスです。
試験に出題される理由: 「データ処理システムの設計」では行キー設計、ホットスポット、SSD対HDDのトレードオフがテストされ、低レイテンシの分析読み取りが必要な場合、BigtableがGCPの解答となります。
自動バックアップ、リードレプリカ、高可用性を備えたマネージドなPostgreSQL、MySQL、SQL Serverで、多くの取り込みパイプラインのリレーショナルソースとなります。
試験に出題される理由: Cloud SQLは「データの取り込みと保存」において、Datastreamまたはスケジュールされたバッチエクスポートを介してBigQueryに変化を供給するアップストリームOLTPデータベースとして登場します。
リアルタイムリスナー、ACIDトランザクション、Enterpriseモードでのグローバルレプリケーションを備えたサーバーレスドキュメントデータベースで、アプリケーション層のイベントキャプチャを支えます。
試験に出題される理由: PDEのストレージシナリオでは、低レイテンシのアプリケーション層への書き込みにFirestoreが選ばれ、その後、EventarcまたはPub/Subを介してBigQueryに流れます。
Cloud Storageおよび外部 (S3, ADLS) データを、きめ細かなアクセス制御とApache Icebergサポートを備えたガバナンスされたBigQueryテーブルとして公開する統合ストレージエンジンです。
試験に出題される理由: BigLakeは「データの保存」におけるレイクハウスの解答であり、外部テーブルのフェデレーションをネイティブなBigQueryストレージと区別し、マルチクラウド分析を可能にします。
低レイテンシでMySQL、PostgreSQL、Oracle、SQL ServerをBigQuery、Cloud Storage、またはCloud SQLにレプリケートするサーバーレスな変更データキャプチャサービスです。
試験に出題される理由: 「データの取り込みと処理」ではCDCパターンがテストされ、Datastreamは、カスタムのDebezium配管なしでログベースのレプリケーションをウェアハウスに実行するためのGCPネイティブな解答です。
150以上のコネクタとコードフリーのパイプラインデザイナーを備え、内部でDataprocにコンパイルされるマネージドなCDAPベースのビジュアルETLプラットフォームです。
試験に出題される理由: PDEでは、問題がDataflowにおける手書きのBeamよりも幅広いコネクタカバレッジを持つローコードのビジュアルETLを好む場合にData Fusionが期待されます。
バージョン管理、依存関係グラフ、アサーション、増分テーブルマテリアライズを備えたBigQueryネイティブなSQLワークフローサービスで、GCP内のdbtに類似しています。
試験に出題される理由: 「データワークロードの維持と自動化」ではウェアハウス内変換パターンがテストされ、DataformはBigQuery中心のELTにおける典型的なSQLオーケストレーションの解答です。
インテリジェントな提案とレシピのエクスポートを備え、構造化/半構造化データの探索、クリーニング、変換を行うためのビジュアルなデータラングリングサービスです。
試験に出題される理由: 「分析のためのデータの準備と使用」では、BigQuery消費前のアナリスト主導のデータ整形のためのノーコードパスとしてDataprepが挙げられます。
検査テンプレートと変換ジョブを使用して、BigQuery、Cloud Storage、Datastore全体でPIIを検出、分類、匿名化するためのマネージドサービスです。
試験に出題される理由: PDEのガバナンスシナリオでは、共有分析レイヤーにデータが到達する前にPIIをマスク、トークン化、または編集するためにSensitive Data Protectionが引用されます。
BigQueryの行レベル、列レベル、ポリシータグベースのきめ細かなアクセスを含む、全てのデータサービスに対するプロジェクトおよびリソーススコープの権限です。
試験に出題される理由: BigQueryデータセット、Cloud Storageバケット、Pub/Subトピックへの最小権限アクセスに関するPDEガバナンスの問題は、全てIAMバインディングと条件に帰着します。
BigQuery、Cloud Storage、Pub/Sub、Dataflow、Spanner用のカスタマーマネージド暗号キー (CMEK) と、Cloud HSMおよび外部キーオプションを備えたマネージドな暗号鍵サービスです。
試験に出題される理由: CMEKによる保存時暗号化は、規制された分析データ、キーローテーション、テナント分離されたマルチチームウェアハウスを保護するためのPDEの典型的な解答です。
BigQuery、Cloud Storage、および外部ソース全体でデータをカタログ化、分類、保護、監視するための統合データファブリックで、ビルトインのデータリネージと品質を備えます。
試験に出題される理由: PDEのガバナンスおよびデータ品質シナリオでは、レイク + ウェアハウス用のGCPネイティブのカタログ/リネージレイヤーとしてDataplexが挙げられ、スタンドアロンのData Catalogを置き換えます。
パイプライン実行、BigQueryジョブメトリクス、Dataflowワーカーのオートスケーリング、Pub/Subバックログ、およびCloud Monitoringポリシーを介したSLOベースのアラートのための統合された可観測性を提供します。
試験に出題される理由: 「データワークロードの維持と自動化」では、ジョブ失敗アラート、スロット使用率ダッシュボード、監査ログ保持のためにCloud Logging + Cloud Monitoringが期待されます。
$140k–$195k–$290k USD 年収
この範囲は、GCP を主要プラットフォームとする米国拠点のシニアデータエンジニアを反映しています。FAANG の L5 データエンジニアの総報酬は30万ドルを超えます。PDE は、求人情報に記載されている給与帯で、単一のデータ認定資格として最も高収入なものの1つとして常に挙げられています。強力な Apache Beam / Dataflow の経験と組み合わせることで、GCP を利用する企業ではプレミアムが付きます。純粋なアナリストエンジニアの役割は低い傾向にあります。
出典: levels.fyi 2025–2026 (Google L4–L5 data engineers, FAANG およびユニコーン企業のシニアデータエンジニア), 米国労働統計局 OEWS May 2024 (15-2051 data scientists, 15-1252 software developers)。数値は概算であり、実際の報酬は職務、地域、経験によって異なります。
PDE は、GCP データ資格の中で最も需要が高く、GCP を多用する企業におけるシニアデータエンジニア職にとって最も強力なシグナルの一つです。デジタルネイティブな GCP 企業(Spotify、Snap、PayPal、Wayfair、いくつかの主要な小売業者やアドテク企業)、BigQuery 中心のアナリティクス組織、およびデータプラクティスを持つ Google Cloud パートナーで高い需要があります。この資格は、Google 社内でもカスタマーエンジニアリングのデータスペシャリスト向けに評価されています。PDE は、エンドツーエンドの「データ + ML」プロファイルのために Professional ML Engineer (PMLE) と、より広範なシニアエンジニアリングプロファイルのために Cloud Architect (PCA) と自然に組み合わせることができます。保有者は、一貫して採用担当者からの強い反応を報告しています。
正式な前提条件はありません。Google は、Google Cloud 上でソリューションを設計および管理した経験が1年以上を含む、業界経験3年以上を推奨しています。実際には、データが初めての人にとって PDE は信頼できる最初の GCP 資格ではありません。成功した候補者は、実用的なパイプラインをリリースし、SQL、Python の実務経験があり、少なくとも Apache Beam の概念的な知識を持っています。
Associate Cloud Engineer (ACE) は一般的な足がかりとなりますが、Associate Data Practitioner (ADP) はデータ固有のコンテンツへのより直接的な道のりです。強力な SQL の流暢さ(ウィンドウ関数、CTEs、ARRAY/STRUCT 操作)、Beam パイプラインのための少なくとも1つのプログラミング言語(Python または Java)の習熟度、およびストリーミングの概念(ウィンドウ処理、ウォーターマーク、厳密に1回限りの配信)が事実上必要とされます。Google Cloud Skills Boost の公式 Data Engineer Learning Path(約50〜80時間のラボ)は良い目安となります。
PDE はプロフェッショナルレベルに評価されており、常に難しいとされています — 多くの候補者は、主にストリーミングおよび Dataflow / Apache Beam のコンテンツのため、PCA / PCNE に次いで2番目に難しい GCP 認定と評価しています。PDE が最初の GCP プロフェッショナル認定である場合は10〜14週間で100〜150時間の学習を、ACE / ADP および本番環境でのデータエンジニアリング経験をすでに持っている場合は5〜8週間で50〜80時間の学習を計画してください。試験は120分間で50〜60の多肢選択式 / 複数選択式問題で構成され、Pearson VUE を通じて提供されます(Google は2026年初頭に Kryterion / Webassessor から移行しました — 2026年2月23日から3月1日までは試験なし、最初の Pearson 配信は2026年3月2日)。
最も一般的なつまずきの石は Dataflow ストリーミングです — ウィンドウ処理戦略(固定、スライディング、セッション)、ウォーターマーク、遅延データ、厳密に1回限りセマンティクスが、不合格の試行の不釣り合いな割合を占めています。2番目のつまずきの石は、複数のオプションが技術的に実行可能なストレージシナリオで BigQuery、Bigtable、Spanner、Cloud SQL のいずれかを選択することです。Google は数値スコアを公開せず、合否のみを通知します。この資格は2年間有効であり、再認定には現在の試験の再受験が必要です。
現在の試験ガイドは2023年初頭に更新され、BigLake、BigQuery Omni、Dataform、Dataplex、Datastream の範囲が追加されました。Vertex AI との ML パイプライン統合が拡張されました。
ストレージと処理のドメインが再調整され、Pub/Sub Lite と Dataflow Prime の範囲が追加された大規模な更新。
最初の一般提供 — 最初の3つの Google Cloud Professional 資格の1つ。
PDE (Google Cloud Professional Data Engineer) は、深い実践経験とアーキテクチャ上のトレードオフ決定を行う能力を必要とする、挑戦的でシナリオ中心の試験 Professionalレベルの試験です。ほとんどの受験者は、プロフェッショナルおよびエキスパートレベルの試験に3〜6か月かけて150〜300時間の学習を必要とします。これらの試験は通常、事前の準専門家レベルの習熟度を想定しています。 練習試験で合格基準を安定して上回るスコアを獲得している受験者のほとんどは、初回で合格しています。
ほとんどの受験者は、プロフェッショナルおよびエキスパートレベルの試験に3〜6か月かけて150〜300時間の学習を必要とします。これらの試験は通常、事前の準専門家レベルの習熟度を想定しています。 合格までの時間は、これまでの経験によって大きく異なります。基礎となるテクノロジーでの実践的な本番経験を持つエンジニアは通常、より少ない時間で済みますが、プラットフォームに初めて触れる受験者は、この範囲の上限を目安に計画を立てる必要があります。
PDEは、GCPエコシステムで認められた資格であり、雇用主、リクルーター、クライアントに検証済みの知識を示します。あなたにとって時間と費用をかける価値があるかどうかは、あなたの役割と目標によります。通常、GCPを日常的に扱っている、またはそのような役割に就きたいと考えているクラウドエンジニア、アーキテクト、コンサルタントにとって最も報われる傾向があります。
PDEの合格点は未公開です。試験には50問の問題が含まれており、所要時間は2 時間です。
PDE試験の受験料は$200 USDです。受験料はGCPによって設定されており、地域によって異なる場合があります。予約する前に、常にGCPの公式認定ページで現在の価格を確認してください。
Google Cloudプロフェッショナル認定は2年間有効です。試験の現在のバージョンを再受験することで再認定されます。
はい。試験はオンライン(プロバイダーのセキュアブラウザを介して監督され、ほとんどの地域で24時間年中無休で利用可能)または営業時間内のピアソンVUE試験センターで対面で受験できます。どちらの形式も同じ問題、時間制限、合格点を使用します。
CertLabProでは、PDEの練習問題バンクで15の学習モードを提供しています。試験シミュレーションモードは、実際の試験を反映しており、2 時間で50問、合格基準は未公開と同じです。ブラウズモードでは、すべてのQ&Aを静的に読むことができます。