Google Cloud Professional Data Engineer
225 שאלות תרגול
נבדק לאחרונה: April 2026
הערות אישיות וקישורים למשאבים למסע הלמידה שלך
סנן לפי הסמכה
הסמכת מהנדס נתונים מקצועי של Google Cloud (PDE) מאשרת את היכולת לתכנן, לבנות, לאבטח ולהפעיל מערכות עיבוד נתונים ב-Google Cloud. בחינה זו היא אחת ההסמכות המקצועיות הפופולריות יותר של GCP ומדורגת באופן עקבי בין הסמכות הנתונים היחידות בעלות השכר הגבוה ביותר בשוק. צפה לכיסוי מעמיק של BigQuery (מחיצות, אשכולות, תצוגות ממוחזרות, BI Engine, BigLake, Omni), Dataflow (אצווה וסטרימינג של Apache Beam, חלוקת חלונות, סימני מים), Pub/Sub, Dataproc, Cloud Composer (Airflow מנוהל), Dataform, Dataplex, Datastream ושילוב Vertex AI עבור צינורות למידת מכונה (ML). סגנון השאלות עתיר תרחישים ומתגמל מועמדים החושבים בו זמנית במונחים של עלות, חביון, טריות ופשרות בהתפתחות סכימה.
ניתוח מערכת מקור, תכנון מחסן נתונים לעומת אגם נתונים לעומת אגם-בית, מודל סכימה עבור BigQuery (דה-נורמליזציה, מקונן, ARRAY/STRUCT), בחירת האחסון הנכון (BigQuery לעומת Bigtable לעומת Spanner לעומת Firestore לעומת Cloud SQL). 22%.
התחום הגדול ביותר עם 25%. תבניות Pub/Sub, אצווה וסטרימינג של Dataflow עם Apache Beam (חלוקת חלונות, טריגרים, סימני מים, סמנטיקה של "בדיוק פעם אחת"), עבודות Spark ב-Dataproc, Datastream CDC, Storage Transfer Service.
מחיצות ואשכולות ב-BigQuery, תצוגות ממוחזרות, BI Engine, טבלאות חיצוניות של BigLake, צילומי מצב ברמת הטבלה ונסיעה בזמן, תכנון סכימת Bigtable, מעברי מחלקות אחסון ב-Cloud Storage. 20%.
BigQuery SQL (פונקציות חלון, מניפולציית ARRAY/STRUCT, אינדקסי חיפוש), BigQuery ML, יסודות מודל סמנטי של Looker, שאילתות מאוחדות ל-Cloud SQL / Spanner / Cloud Storage, אינטגרציה עם Vertex AI. 15%.
DAGs ב-Cloud Composer, זרימות עבודה של Dataform, שאילתות מתוזמנות ב-BigQuery, הזמנות משבצות ותמחור לפי דרישה, ניטור עם Cloud Monitoring, IAM ברמת מערך הנתונים / טבלה / עמודה / שורה. 18%.
שירותים שתפגוש במבחן ומדוע כל אחד מהם חשוב.
מחסן נתונים עמודתי serverless עם הפרדה בין אחסון למחשוב, חריצים לפי דרישה וחריצי הזמנה, BigQuery ML למידול בתוך המחסן, ותצוגות ממוחזרות עבור צבירים אינקרימנטליים.
מדוע הוא במבחן: BigQuery הוא משטח האנליטיקה המרכזי בכל חמשת דומייני ה-PDE — חלוקה למחיצות, קיבוץ, הזמנת חריצים ואופטימיזציית שאילתות שולטים בבחינה.
אחסון אובייקטים המהווה את עוגן אגם הנתונים של GCP — אזורי נחיתה/אצירה/צריכה, דליים מרובי-אזורים ודו-אזוריים, מדיניות מחזור חיים, ומקור לכל שירות אנליטיקה במורד הזרם.
מדוע הוא במבחן: כל תרחיש אחסון וקליטה ב-PDE מניח את Cloud Storage כתשתית; מחלקות אחסון, מדיניות שמירה ודפוסי גישת URL חתומים מניעים שאלות ב-אחסון הנתונים.
רָץ Apache Beam מנוהל במלואו עבור צינורות streaming ו-batch מאוחדים, עם עובדים עם autoscaling, Streaming Engine, ו-Flex Templates לפריסות הניתנות לשחזור.
מדוע הוא במבחן: Dataflow הוא התשובה הקנונית ב-קליטה ועיבוד נתונים — שאלות על חלונות, טריגרים, סמנטיקת exactly-once, וטרייד-אופים בין streaming ל-batch, כולן נוחתות כאן.
קלאסטרים מנוהלים של Spark, Hadoop, Hive, Presto ו-Flink עם autoscaling ארעי, Dataproc Serverless עבור Spark ב-batch, ו-Spark-on-GKE עבור תשתית משותפת.
מדוע הוא במבחן: PDE מצפה ל-Dataproc כיעד ההגירה עבור עומסי עבודה קיימים של Spark/Hadoop — ארעי מול ארוך טווח, מדיניות autoscaling, ובחירות Dataproc-vs-Dataflow מופיעות ב-תכנון מערכות עיבוד נתונים.
שירות הודעות מבוזר גלובלית לקליטה אסינכרונית, עם אספקה at-least-once, מפתחות סידור, dead-letter topics, ו-Pub/Sub Lite עבור streams אזוריים אופטימליים עלויות.
מדוע הוא במבחן: Pub/Sub הוא משטח קליטת ה-streaming המוגדר כברירת מחדל ב-קליטה ועיבוד נתונים — סמנטיקת אספקה, סוגי מנויים והתנהגות backlog הם נושאי בחינה חוזרים.
שירות Apache Airflow מנוהל לתזמור DAGs בין-שירותים המשתרעים על BigQuery, Dataflow, Dataproc, ומערכות חיצוניות, כאשר Composer 2 רץ על GKE Autopilot.
מדוע הוא במבחן: תחזוקה ואוטומציה של עומסי עבודה בוחנת דפוסי DAG, ניסיונות חוזרים וניטור SLA — Composer הוא המתזמר הנקוב ב-PDE לעומת Workflows עבור שרשראות פשוטות יותר.
מסד נתונים יחסי מבוזר גלובלית עם עקביות חזקה, קנה מידה אופקי ו-SQL — משמש כמערכת התפעולית של הרישום המזינה צינורות אנליטיקה.
מדוע הוא במבחן: שאלות אחסון ב-PDE מבחינות בין OLTP (Spanner) ל-OLAP (BigQuery) ושואלות מתי שאילתות מאוחדות של Spanner מ-BigQuery עדיפות על צינור CDC.
שירות NoSQL עם עמודות רחבות וקריאות בודדות במילישניות בקנה מידה של פטאבייט, ממוטב עבור עומסי עבודה של time-series ו-IoT עם תאימות ל-HBase API.
מדוע הוא במבחן: תכנון מערכות עיבוד נתונים בוחן תכנון מפתחות שורה, hotspotting, וטרייד-אופים בין SSD ל-HDD — Bigtable הוא התשובה של GCP בכל פעם שנדרשות קריאות אנליטיות בהשהיה נמוכה.
PostgreSQL, MySQL ו-SQL Server מנוהלים עם גיבויים אוטומטיים, read replicas וזמינות גבוהה — המקור היחסי עבור צינורות קליטה רבים.
מדוע הוא במבחן: Cloud SQL מופיע ב-קליטה ועיבוד נתונים וב-אחסון נתונים כמסד הנתונים OLTP במעלה הזרם ששינוייו מזינים את BigQuery דרך Datastream או ייצוא batch מתוזמן.
מסד נתונים מסמכים serverless עם מאזיני זמן אמת, טרנזקציות ACID, ושכפול גלובלי במצב Enterprise — מגבה לכידת אירועים בשכבת היישום.
מדוע הוא במבחן: תרחישי אחסון ב-PDE בוחרים ב-Firestore עבור כתיבות בשכבת היישום בהשהיה נמוכה אשר זורמות לאחר מכן ל-BigQuery דרך Eventarc או Pub/Sub.
מנוע אחסון מאוחד החושף נתוני Cloud Storage ונתונים חיצוניים (S3, ADLS) כטבלאות BigQuery מנוהלות עם בקרת גישה מדויקת ותמיכה ב-Apache Iceberg.
מדוע הוא במבחן: BigLake הוא התשובה של lakehouse ב-אחסון נתונים — מבחין בין איחוד טבלאות חיצוניות לאחסון BigQuery מקורי ומאפשר אנליטיקה מרובת-עננים.
שירות serverless ללכידת שינויי נתונים (CDC) המשכפל MySQL, PostgreSQL, Oracle, ו-SQL Server לתוך BigQuery, Cloud Storage, או Cloud SQL בהשהיה נמוכה.
מדוע הוא במבחן: קליטה ועיבוד נתונים בוחנת דפוסי CDC; Datastream הוא התשובה המקורית של GCP לשכפול מבוסס-לוג לתוך מחסן הנתונים ללא צנרת Debezium מותאמת אישית.
פלטפורמת ETL ויזואלית מנוהלת מבוססת CDAP עם למעלה מ-150 מחברים ומעצב צינורות ללא קוד שמתקמפל ל-Dataproc מתחת למכסה המנוע.
מדוע הוא במבחן: PDE מצפה ל-Data Fusion כאשר שאלה מעדיפה ETL ויזואלי ב-low-code עם כיסוי מחברים רחב על פני Beam כתוב ידנית ב-Dataflow.
שירות SQL workflow מקורי ל-BigQuery עם בקרת גרסאות, גרפי תלות, אסרציות, ומטריאליזציות טבלה אינקרימנטליות — אנלוגי ל-dbt בתוך GCP.
מדוע הוא במבחן: תחזוקה ואוטומציה של עומסי עבודה בוחנת דפוסי טרנספורמציה בתוך המחסן; Dataform היא התשובה הקנונית לתזמור SQL עבור ELT ממוקד BigQuery.
שירות ויזואלי לסידור נתונים (data wrangling) לחקירה, ניקוי וטרנספורמציה של נתונים מובנים/חצי-מובנים עם הצעות חכמות וייצוא מתכונים.
מדוע הוא במבחן: הכנה ושימוש בנתונים לניתוח נוקב ב-Dataprep כנתיב ה-no-code לעיצוב נתונים מונחה-אנליסטים לפני צריכת BigQuery.
שירות מנוהל לגילוי, סיווג וביטול זיהוי של PII ברחבי BigQuery, Cloud Storage ו-Datastore באמצעות תבניות בדיקה ומשימות טרנספורמציה.
מדוע הוא במבחן: תרחישי ממשל ב-PDE מצטטים את Sensitive Data Protection למיסוך, אסימון או מחיקת PII לפני שהנתונים נוחתים בשכבות אנליטיקה משותפות.
הרשאות בהיקף פרויקט ומשאב עבור כל שירות נתונים, כולל גישה מדויקת מבוססת תגי מדיניות, רמת שורה ורמת עמודה ב-BigQuery.
מדוע הוא במבחן: שאלות ממשל ב-PDE על גישת least-privilege למערכי נתונים של BigQuery, דליים של Cloud Storage ו-topics של Pub/Sub כולן חוזרות ל-IAM bindings ותנאים.
מפתחות קריפטוגרפיים מנוהלים עם מפתחות הצפנה בניהול לקוח (CMEK) עבור BigQuery, Cloud Storage, Pub/Sub, Dataflow, ו-Spanner, בתוספת Cloud HSM ואפשרויות מפתח חיצוני.
מדוע הוא במבחן: הצפנה במנוחה עם CMEK היא התשובה הקנונית ב-PDE להגנה על נתוני אנליטיקה מפוקחים, סיבוב מפתחות ומחסני נתונים מבודדי דיירים עבור צוותים מרובים.
פלטפורמת נתונים מאוחדת לקטלוג, סיווג, אבטחה וניטור נתונים ברחבי BigQuery, Cloud Storage ומקורות חיצוניים, עם lineage ואיכות נתונים מובנים.
מדוע הוא במבחן: תרחישי ממשל ואיכות נתונים ב-PDE נוקבים ב-Dataplex כשכבת הקטלוג/lineage המקורית של GCP עבור lake + warehouse, המחליפה את Data Catalog העצמאי.
יכולת צפייה (observability) מאוחדת עבור הרצות צינורות, מדדי משימות BigQuery, autoscaling של עובדי Dataflow, backlog של Pub/Sub, והתראות מבוססות SLO באמצעות מדיניות Cloud Monitoring.
מדוע הוא במבחן: תחזוקה ואוטומציה של עומסי עבודה מצפה ל-Cloud Logging + Cloud Monitoring עבור התראות על כשל במשימות, לוחות מחוונים לניצול חריצים ושמירת audit-log.
$140k–$195k–$290k USD שנתי
הטווח משקף מהנדסי נתונים בכירים בארה"ב כאשר GCP היא הפלטפורמה העיקרית. שכר כולל (TC) של מהנדס נתונים L5 ב-FAANG עובר את ה-300 אלף דולר. PDE מצוינת באופן עקבי כאחת מהסמכות הנתונים היחידות בעלות השכר הגבוה ביותר לפי טווחי שכר בפרסומי משרות; בשילוב עם ניסיון חזק ב-Apache Beam / Dataflow היא מפקדת על פרמיה בחברות המשתמשות ב-GCP. תפקידי אנליסט-מהנדס טהורים נוטים להיות נמוכים יותר.
מקור: levels.fyi 2025–2026 (מהנדסי נתונים L4–L5 בגוגל, מהנדסי נתונים בכירים ב-FAANG ובחברות יוניקורן), U.S. BLS OEWS May 2024 (15-2051 data scientists, 15-1252 software developers). הנתונים משוערים; התגמול בפועל תלוי בתפקיד, באזור ובניסיון.
PDE היא הסמכת הנתונים המבוקשת ביותר ב-GCP ואחד הסימנים החזקים ביותר לתפקידי מהנדס נתונים בכיר בחברות המסתמכות במידה רבה על GCP. קיימת דרישה גבוהה בחברות GCP דיגיטליות מלידה (Spotify, Snap, PayPal, Wayfair, כמה קמעונאים גדולים וחברות אד-טק), בארגוני אנליטיקה ממוקדי BigQuery, ובשותפים של Google Cloud עם פרקטיקות נתונים. ההסמכה מוערכת גם בגוגל עצמה עבור מומחי נתוני הנדסת לקוחות. PDE משתלבת באופן טבעי עם הסמכת מהנדס למידת מכונה מקצועי (PMLE) לפרופיל "נתונים + ML" מקצה לקצה, ועם אדריכל ענן (PCA) לפרופיל הנדסה בכירה רחב יותר. בעלי ההסמכה מדווחים באופן עקבי על תגובה חזקה מצד מגייסים.
אין דרישות קדם רשמיות. גוגל ממליצה על שלוש שנות ניסיון בתעשייה או יותר, כולל שנה אחת או יותר בתכנון וניהול פתרונות ב-Google Cloud. בפועל, PDE אינה הסמכת GCP ראשונה אמינה למי שחדש בתחום הנתונים — מועמדים מצליחים יישמו צינורות נתונים משמעותיים ויש להם ידע עבודה ב-SQL, Python, ולפחות היכרות רעיונית עם Apache Beam.
הסמכת Associate Cloud Engineer (ACE) היא אבן דרך נפוצה, אך Associate Data Practitioner (ADP) היא מסלול ישיר יותר לתוכן הספציפי לנתונים. שליטה חזקה ב-SQL (פונקציות חלון, CTEs, מניפולציית ARRAY/STRUCT), נוחות עם לפחות שפת תכנות אחת עבור צינורות Beam (Python או Java), והיכרות עם מושגי סטרימינג (חלוקת חלונות, סימני מים, אספקה "בדיוק פעם אחת") נדרשים בפועל. מסלול הלמידה הרשמי למהנדס נתונים ב-Google Cloud Skills Boost (כ-50–80 שעות מעבדה) מהווה בסיס טוב.
PDE מדורגת כמקצועית והיא קשה באופן עקבי — מועמדים רבים מדרגים אותה כהסמכת GCP השנייה הכי קשה אחרי PCA / PCNE, בעיקר בגלל תוכן הסטרימינג ו-Dataflow / Apache Beam. תכנן 100–150 שעות לימוד במשך 10–14 שבועות אם PDE היא ההסמכה המקצועית הראשונה שלך ב-GCP, או 50–80 שעות במשך 5–8 שבועות אם כבר יש לך ACE / ADP בתוספת ניסיון בהנדסת נתונים בסביבת ייצור. הבחינה כוללת 50–60 שאלות רב-ברירה / בחירה מרובה ב-120 דקות, מועברת דרך Pearson VUE (גוגל עברה מ-Kryterion / Webassessor בתחילת 2026 — אין בחינות בין 23 בפברואר ל-1 במרץ 2026; מסירת Pearson ראשונה ב-2 במרץ 2026).
המכשול הנפוץ ביותר הוא סטרימינג ב-Dataflow — אסטרטגיות חלוקת חלונות (קבועים, הזזה, סשן), סימני מים, נתונים מאוחרים, וסמנטיקה של "בדיוק פעם אחת" מהווים חלק לא פרופורציונלי מניסיונות כושלים. המכשול השני הוא הבחירה בין BigQuery, Bigtable, Spanner, ו-Cloud SQL לתרחישי אחסון שבהם מספר אפשרויות קיימות מבחינה טכנית. גוגל אינה מפרסמת ציונים מספריים — רק עובר/נכשל. ההסמכה תקפה לשנתיים וחידושה דורש מעבר מחדש של הבחינה הנוכחית.
מדריך הבחינה הנוכחי עודכן בתחילת 2023 כדי להוסיף כיסוי ל-BigLake, BigQuery Omni, Dataform, Dataplex ו-Datastream. אינטגרציה מורחבת של צינורות ML עם Vertex AI.
רענון משמעותי שאיזן מחדש את תחומי האחסון והעיבוד והוסיף כיסוי ל-Pub/Sub Lite ו-Dataflow Prime.
זמינות כללית מקורית — אחת משלוש הסמכות Google Cloud Professional הראשונות.
PDE (Google Cloud Professional Data Engineer) הוא מבחן ברמת Professional מבחן מאתגר ועשיר בתרחישים הדורש ניסיון מעמיק ויכולת לקבל החלטות על פשרות אדריכליות. רוב המועמדים זקוקים ל-150–300 שעות לימוד הפרוסות על פני 3–6 חודשים עבור מבחני רמת מקצועי ומומחה. מבחנים אלו מצפים בדרך כלל למיומנות קודמת ברמת Associate. רוב המועמדים שמקבלים ציונים באופן עקבי מעל סף המעבר במבחני תרגול עוברים בניסיון הראשון.
רוב המועמדים זקוקים ל-150–300 שעות לימוד הפרוסות על פני 3–6 חודשים עבור מבחני רמת מקצועי ומומחה. מבחנים אלו מצפים בדרך כלל למיומנות קודמת ברמת Associate. משך הזמן למעבר משתנה מאוד בהתאם לניסיון קודם. מהנדסים בעלי ניסיון מעשי בסביבת ייצור בטכנולוגיה הבסיסית זקוקים בדרך כלל לפחות זמן; מועמדים חדשים לפלטפורמה צריכים לתכנן את לימודיהם לכיוון הקצה העליון של טווח זה.
PDE הוא אישור מוכר במערכת האקולוגית של GCP ומסמן ידע מאומת למעסיקים, מגייסים ולקוחות. האם זה שווה את הזמן והעמלה עבורך תלוי בתפקיד ובמטרות שלך – זה נוטה להשתלם ביותר עבור מהנדסי ענן, אדריכלים ויועצים שעובדים עם GCP על בסיס יומיומי או רוצים לעבור לתפקידים כאלה.
ציון המעבר עבור PDE הוא לא פורסם. המבחן מכיל 50 שאלות ונמשך 2 שע'.
עמלת מבחן ה-PDE היא $200 USD. העמלות נקבעות על ידי GCP ועשויות להשתנות לפי אזור; תמיד אשרו את המחיר הנוכחי בדף ההסמכה הרשמי של GCP לפני ההזמנה.
הסמכות Google Cloud Professional תקפות למשך שנתיים. ניתן לחדש הסמכה על ידי מעבר חוזר של הגרסה הנוכחית של המבחן.
כן. ניתן לגשת למבחן באופן מקוון (בפיקוח דרך הדפדפן המאובטח של הספק, זמין 24/7 ברוב האזורים) או במרכז בחינה פיזי של Pearson VUE בשעות הפעילות. שני הפורמטים משתמשים באותן שאלות, מגבלת זמן וציון מעבר.
CertLabPro מספק 15 מצבי לימוד על פני בנק השאלות לתרגול עבור PDE. מצב סימולציית המבחן משקף את המבחן האמיתי: 50 שאלות ב-2 שע', עם אותו סף מעבר של לא פורסם. מצב עיון מאפשר לך לקרוא כל שאלה ותשובה באופן סטטי.