AWS Certified Data Engineer Associate
275 שאלות תרגול
נבדק לאחרונה: April 2026
הערות אישיות וקישורים למשאבים למסע הלמידה שלך
סנן לפי הסמכה
ההסמכה AWS Certified Data Engineer Associate (DEA-C01) הושקה במרץ 2024 כיורשת ממוקדת-פרקטיקאים של הסמכת Data Analytics Specialty שפרשה. היא מאמתת את היכולת לתכנן, לבנות, לתפעל ולאבטח צינורות נתונים ועומסי עבודה אנליטיים ב-AWS — כולל קליטה, טרנספורמציה, אחסון, תזמור וניהול. הבחינה מיועדת למהנדסי נתונים, מהנדסי אנליטיקה ומפתחי ETL העובדים עם ערימות טכנולוגיה מבוססות AWS. דגש חזק על Glue, Lambda, Kinesis Data Streams / Firehose, Managed Kafka (MSK), אגמי נתונים ב-S3, Lake Formation, Athena, Redshift ו-EMR. צפו לשאלות מבוססות תרחישים בנושאי בחירות קליטה מודעות לעלות, פורמט קבצים ואסטרטגיית חלוקה, ואמינות צינור הנתונים. DEA-C01 היא קונספטואלית (ללא מעבדות) אך מניחה ניסיון מעשי בבניית צינורות נתונים.
התחום הגדול ביותר עם 34%. בחירת Kinesis Data Streams לעומת Firehose לעומת MSK, עבודות ETL של Glue ו-DataBrew, Lambda עבור ETL קל משקל, ו-AppFlow עבור מקורות SaaS. נקודת מכשול נפוצה: בחירת שירות הקליטה הנכון תחת אילוצי latency וסדר.
תכנון אגם נתונים ב-S3, פורמטים של קבצים (Parquet, ORC, Avro), חלוקה (partitioning), ניהול Lake Formation, ארכיטקטורת Redshift (RA3, Serverless), ו-DynamoDB עבור עומסי עבודה תפעוליים. בוחן החלפות אחסון מעשיות.
תזמור זרימות עבודה עם Step Functions, Glue Workflows, MWAA (Managed Airflow), ו-EventBridge. ניטור CloudWatch של עבודות נתונים, ניסיונות חוזרים והתראות. לעיתים קרובות מפספסים: מתי MWAA מוצדק לעומת Step Functions פשוטים יותר.
הרשאות Lake Formation, גישה מדויקת באמצעות אבטחה ברמת שורה/עמודה, KMS להצפנה במנוחה, דפוסי IAM לשיתוף נתונים בין חשבונות, וזיהוי PII (Macie). משקל קטן יותר (18%) אך שאלות בעלות צפיפות גבוהה.
שירותים שתפגוש במבחן ומדוע כל אחד מהם חשוב.
פלטפורמת ETL serverless עם סביבת ריצה מנוהלת של Spark/Python, Crawlers לגילוי סכמה, Glue Data Catalog, ו-Glue DataBrew לטרנספורמציה ב-low-code.
מדוע הוא במבחן: Glue הוא השירות המרכזי בדומיין אגירת וטרנספורמציית נתונים — צפו לשאלות על job bookmarks, dynamic frames, אסטרטגיית חלוקה, וטרייד-אופים בין DataBrew ל-Glue Studio.
אחסון אובייקטים המשמש כבסיס לאגם הנתונים של AWS — אזור נחיתה, שכבות גולמיות / מעובדות / צריכה, ומקור לכל שירותי האנליטיקה הבאים.
מדוע הוא במבחן: כל תרחיש אחסון ואגירה ב-DEA-C01 מניח את S3 כתשתית; storage classes, lifecycle, Intelligent-Tiering, ופריסת מחיצות מניעים שאלות בדומיין ניהול אחסוני נתונים.
מחסן נתונים ענן מנוהל עם אחסון MPP עמודתי, RA3 עם הפרדת מחשוב/אחסון, Redshift Spectrum מעל S3, ואגירת zero-ETL מ-Aurora.
מדוע הוא במבחן: שאלות בדומיין ניהול אחסוני נתונים משוות שוב ושוב את Redshift (מחסן נתונים) מול Athena/Glue/Lake Formation (lakehouse) — distribution keys, sort keys וניהול עומסי עבודה נוחתים כאן.
סביבת ריצה מנוהלת של Hadoop / Spark / Hive / Presto / Flink התומכת ב-EMR on EC2, EMR Serverless, ו-EMR on EKS עבור משימות batch ו-streaming בקנה מידה גדול.
מדוע הוא במבחן: תרחישי אגירת וטרנספורמציית נתונים שחורגים מקנה המידה של Glue או דורשים אינטגרציית Spark/Hudi/Iceberg מציינים את EMR כתשובה.
שירות streaming נתונים בזמן אמת לאגירת אירועי clickstream, IoT, יישומים ולוגים בקנה מידה גדול, עם קיבולת מבוססת shard או לפי דרישה ואפשרות ל-replay בתוך חלון השמירה.
מדוע הוא במבחן: דומיין אגירת וטרנספורמציית נתונים בוחן תכנון אגירת streaming — Kinesis Data Streams הוא המקור הילידי של AWS לצינורות בשהייה נמוכה המזינים את Firehose, Lambda או Flink.
שירות העברת streaming מנוהל שאוגר, מכווץ ומנחית רשומות ל-S3, Redshift, OpenSearch, Splunk או נקודות קצה HTTP עם טרנספורמציית Lambda אופציונלית.
מדוע הוא במבחן: Firehose היא התשובה הקנונית בדומיין אגירת נתונים כאשר שאלה דורשת העברה מנוהלת וכמעט בזמן אמת ל-sink ללא כתיבת קוד consumer.
מנוע SQL אינטראקטיבי serverless מעל S3 (ומקורות מאוחדים) המשתמש ב-Glue Data Catalog, עם workgroups לבקרת עלויות/גישה ותמחור pay-per-query.
מדוע הוא במבחן: תרחישי תפעול ותמיכה בנתונים משתמשים ב-Athena לחקירה אד-הוק של נתוני אגם וכשכבת השאילתות מאחורי ממשל Lake Formation.
שירות Apache Airflow מנוהל ליצירה, תזמון וניטור צינורות נתונים כ-DAGs של Python עם תמיכה מלאה במפעילי/חיישני Airflow.
מדוע הוא במבחן: שאלות בדומיין תפעול ותמיכה בנתונים על תזמור צינורות מבחינות בין MWAA (ילידי Airflow, code-first) לבין Step Functions (state-machine) — בחרו ב-MWAA עבור DAGs מורכבים בין שירותים.
שכבת בקרת גישה מדויקת (fine-grained) מעל Glue Data Catalog המספקת הרשאות מבוססות שורה, עמודה ותג בכל שירותי Athena, Redshift Spectrum, EMR ו-Glue.
מדוע הוא במבחן: דומיין אבטחת נתונים וממשל בוחן את Lake Formation כתשובה הילידית של AWS לאבטחת נתונים ברמת שורה/עמודה באגם, המחליפה דפוסי IAM ישירים על S3.
מסד נתונים NoSQL serverless מסוג key-value / document עם שהייה בודדת-ספרתית במילישניות, קיבולת לפי דרישה או מוקצית מראש, Streams ל-CDC, וייצוא zero-ETL ל-S3.
מדוע הוא במבחן: דומיין ניהול אחסוני נתונים משווה את DynamoDB (NoSQL תפעולי) מול אפשרויות יחסיות ומחסני נתונים; DynamoDB Streams מניעים CDC לתוך האגם.
מסדי נתונים יחסיים מנוהלים (PostgreSQL, MySQL, Oracle, SQL Server, MariaDB) בתוספת Aurora — כולל שכפול zero-ETL ל-Redshift לצורך אנליטיקה.
מדוע הוא במבחן: דומיין ניהול אחסוני נתונים ודומיין אגירת נתונים שניהם מתייחסים ל-RDS/Aurora כמקור התפעולי המזין את מחסן הנתונים באמצעות zero-ETL, DMS או שכפול לוגי.
שירות מנוהל לשכפול חד-פעמי ומתמשך (CDC) בין מסדי נתונים הטרוגניים — Oracle/SQL Server ל-Aurora/Redshift, מ-on-prem ל-AWS.
מדוע הוא במבחן: דומיין אגירת וטרנספורמציית נתונים בוחן את DMS כתשובה הקנונית ל-migration / CDC כאשר המקור הוא RDBMS תפעולי ולא stream או קובץ.
מתזמר workflow serverless עם אינטגרציות ילידיות עבור Glue, EMR, Lambda, Athena, SageMaker, ו-DynamoDB, הממדל צינורות נתונים כ-state machines מסוג Standard או Express.
מדוע הוא במבחן: שאלות בדומיין תפעול ותמיכה בנתונים מבחינות בין Step Functions (state-machine, מהיר / ארוך טווח) לבין MWAA (DAGs של Airflow) — Step Functions מנצח עבור זרימות מונעות אירועים וילידיות ל-AWS.
Event bus serverless שמנתב אירועי שירותי AWS, אירועי שותפים ואירועים מותאמים אישית ליעדים (Lambda, Step Functions, Firehose, SQS) עם סינון מבוסס תוכן ולוחות זמנים.
מדוע הוא במבחן: דומיין תפעול ותמיכה בנתונים משתמש ב-EventBridge כדי להפעיל צינורות נתונים לפי לוח זמנים או באירועי הגעת נתונים וכדי להפיץ אותות בין צוותים.
שירות מחשוב serverless המשמש לטרנספורמציית רשומות תוך כדי תנועה (Firehose / Kinesis), דבק ETL קל משקל, pre-processing מונע אירועי S3, ולוגיקה מותאמת אישית של צינורות נתונים.
מדוע הוא במבחן: דומיין אגירת וטרנספורמציית נתונים מצפה ל-Lambda עבור מקרי שימוש של טרנספורמציית נתוני Firehose ועבור חיבור שלבים מונעי אירועים שאינם מצדיקים את Glue או EMR.
שירות OpenSearch מנוהל (ו-Elasticsearch מדור קודם) לחיפוש, ניתוח לוגים וצפייה — כולל OpenSearch Serverless עבור עומסי עבודה בקיבולת משתנה.
מדוע הוא במבחן: דומיין ניהול אחסוני נתונים ודומיין תפעול נתונים מציינים את OpenSearch כיעד לניתוח לוגים וכשירות יעד של Firehose / Kinesis עבור טלמטריה ניתנת לחיפוש.
שירות BI serverless עם מנוע SPICE in-memory, תובנות ML, אנליטיקה מוטמעת, ו-Q (שפה טבעית) לשאילתות על מקורות Redshift, Athena, RDS ו-S3.
מדוע הוא במבחן: שאלות בדומיין תפעול ותמיכה בנתונים על הגשת אנליטיקה למשתמשים עסקיים מציינות את QuickSight כשכבת הצריכה הילידית של AWS מעל האגם/מחסן הנתונים.
בקרת גישה רוחבית לחשבון: משתמשים, roles, מדיניות, federation, והרשאות least-privilege עבור כל Glue job, אובייקט S3, שאילתת Redshift, ושלב בצינור נתונים.
מדוע הוא במבחן: דומיין אבטחת נתונים וממשל מעוגן ב-IAM — execution roles עבור Glue/EMR, שיתוף נתונים בין חשבונות, ומדיניות bucket מבוססות משאבים הן שאלות חוזרות.
יצירה ושליטה מנוהלות במפתחות קריפטוגרפיים המשמשים להצפנת אובייקטי S3, אשכולות Redshift, נפחי RDS, רשומות Kinesis ומטא-דאטה של Glue Data Catalog במנוחה.
מדוע הוא במבחן: דומיין אבטחת נתונים וממשל מצפה למפתחות מנוהלי-לקוח של KMS (CMKs) עבור הצפנה במנוחה עם סיבוב מפתחות ניתן לביקורת בכל שירות אחסון וצינור נתונים.
יומן ביקורת רוחבי לחשבון של כל קריאת API — מי השיק Glue job, מי שאילתת Redshift, מי שינה הרשאות Lake Formation, מי ייצא נתונים מ-S3.
מדוע הוא במבחן: תרחישי ציות בדומיין אבטחת נתונים וממשל מציינים את CloudTrail כרשומה הבלתי ניתנת לשינוי הנדרשת עבור ביקורת, חקירה פורנזית וראיות רגולטוריות.
$105k–$150k–$215k USD שנתי
הטווח מכסה תפקידי הנדסת נתונים בדרג ביניים עד בכיר בארה"ב שבהם נדרשת מיומנות ב-AWS. חברות FAANG וחברות גדולות עתירות נתונים עולות לעיתים קרובות על $260k TC בדרגים בכירים. תפקידי כניסה ושווקים שאינם באזורי החוף נוטים להיות נמוכים יותר. DEA-C01 הוא איתות אמין אך לעיתים רחוקות גורם יחיד בקבלת עובדים.
מקור: תפקידי הנדסת נתונים ב-levels.fyi 2025–2026, הלשכה לסטטיסטיקה של העבודה בארה"ב OEWS מאי 2024 (15-1252 software developers, 15-2051 data scientists). הנתונים משוערים; התגמול בפועל תלוי בתפקיד, באזור ובניסיון.
הגיוס בתחום הנדסת הנתונים נשאר חזק לאורך 2024–2026 כאשר ארגונים המשיכו לבנות אגמי נתונים בענן, ארכיטקטורות lakehouse ופלטפורמות אנליטיקה. DEA-C01 משמש כאות אמין ספציפי ל-AWS לצד ניסיון עם Snowflake, Databricks, או dbt. מגייסים בחברות נתונים ממוקדות AWS משתמשים בו כמסנן מהיר יחד עם שליטה ב-SQL, Python ו-Spark. הוא משתלב באופן טבעי עם Solutions Architect Associate (SAA-C03), Machine Learning Engineer Associate (MLA-C01), וכלים ניטרליים לספק כמו Airflow ו-dbt. ההסמכה אינה מכשירה בפני עצמה מועמדים לתפקידי מהנדס נתונים בדרג בכיר או מוביל פלטפורמת נתונים — תפקידים אלה דורשים בעלות מוכחת על צינורות נתונים בקנה מידה גדול וניסיון רחב יותר בתכנון מערכות.
אין דרישות קדם רשמיות. AWS ממליצה על לפחות 2–3 שנות ניסיון כללי בהנדסת נתונים ולפחות שנה אחת של ניסיון מעשי עם שירותי נתונים של AWS.
רוב המועמדים ניגשים ל-DEA-C01 לאחר SAA-C03 (יסודות ארכיטקטוניים) או ישירות מרקע חזק ב-Spark/SQL/Python. CLF-C02 מהווה חימום שימושי למחליפי קריירה ללא חשיפה ל-AWS. ההכנה היעילה ביותר לפרויקט אישי היא בניית צינור נתונים מקצה לקצה: Kinesis Firehose → S3 (Parquet, מחיצות) → Glue catalog → Athena ו-Redshift Serverless, עם Step Functions או Glue Workflows לתזמור ו-Lake Formation לניהול. מועמדים מרקעים של נתונים שאינם AWS (לדוגמה, Hadoop מקומי או Snowflake בלבד) צריכים לתכנן זמן נוסף על Glue, Lake Formation ומשפחת Kinesis.
DEA-C01 מדורגת כרמת Associate ודומה בקושי ל-SAA-C03, עם משטח שירות ממוקד יותר. תכננו 70–110 שעות לאורך 8–12 שבועות עבור מועמדים עם ניסיון קודם בהנדסת נתונים; 120–160 שעות עבור אלה ללא ניסיון. הבחינה כוללת 65 שאלות מדורגות ב-130 דקות — מרובה ברירה ומרובה תשובות, ללא מעבדות.
נקודות מכשול נפוצות כוללות הבחנה בין Kinesis Data Streams (צרכנים מותאמים אישית, סדר, שמירה) לבין Firehose (מסירה מנוהלת, טרנספורמציות) ו-MSK (תואם Kafka); ידיעה איזה מתזמר (Step Functions, Glue Workflows, MWAA, EventBridge Scheduler) מתאים לצינור נתונים נתון; ומקרי קצה של ירושת הרשאות ב-Lake Formation. חישובים של פורמט קבצים וחלוקה (יחסי דחיסה, קיטום עמודות Parquet) מופיעים באופן קבוע.
זמינות כללית ראשונית. בחינת הבטא נערכה בסוף 2023. מחליף את ה-Data Analytics Specialty (DAS-C01) שפרשה, עבור מועמדים ממוקדי הנדסה. גרסה נוכחית החל מאפריל 2026.
DEA-C01 (AWS Certified Data Engineer Associate) הוא מבחן ברמת Associate מבחן קשה במידה, המצפה לניסיון מעשי בתוספת הבנה מוצקה של שיטות עבודה מומלצות. רוב המועמדים זקוקים ל-80–150 שעות לימוד הפרוסות על פני 6–12 שבועות עבור מבחני רמת Associate. רוב המועמדים שמקבלים ציונים באופן עקבי מעל סף המעבר במבחני תרגול עוברים בניסיון הראשון.
רוב המועמדים זקוקים ל-80–150 שעות לימוד הפרוסות על פני 6–12 שבועות עבור מבחני רמת Associate. משך הזמן למעבר משתנה מאוד בהתאם לניסיון קודם. מהנדסים בעלי ניסיון מעשי בסביבת ייצור בטכנולוגיה הבסיסית זקוקים בדרך כלל לפחות זמן; מועמדים חדשים לפלטפורמה צריכים לתכנן את לימודיהם לכיוון הקצה העליון של טווח זה.
DEA-C01 הוא אישור מוכר במערכת האקולוגית של AWS ומסמן ידע מאומת למעסיקים, מגייסים ולקוחות. האם זה שווה את הזמן והעמלה עבורך תלוי בתפקיד ובמטרות שלך – זה נוטה להשתלם ביותר עבור מהנדסי ענן, אדריכלים ויועצים שעובדים עם AWS על בסיס יומיומי או רוצים לעבור לתפקידים כאלה.
ציון המעבר עבור DEA-C01 הוא 720 / 1000. המבחן מכיל 65 שאלות ונמשך 2 שע' 10 דק'.
עמלת מבחן ה-DEA-C01 היא $150 USD. העמלות נקבעות על ידי AWS ועשויות להשתנות לפי אזור; תמיד אשרו את המחיר הנוכחי בדף ההסמכה הרשמי של AWS לפני ההזמנה.
הסמכות AWS תקפות למשך 3 שנים. ניתן לחדש הסמכה על ידי מעבר הגרסה הנוכחית של אותו מבחן, או על ידי מעבר מבחן ברמה גבוהה יותר באותו מסלול לפני התפוגה.
כן. ניתן לגשת למבחן באופן מקוון (בפיקוח דרך הדפדפן המאובטח של הספק, זמין 24/7 ברוב האזורים) או במרכז בחינה פיזי של Pearson VUE בשעות הפעילות. שני הפורמטים משתמשים באותן שאלות, מגבלת זמן וציון מעבר.
CertLabPro מספק 15 מצבי לימוד על פני בנק השאלות לתרגול עבור DEA-C01. מצב סימולציית המבחן משקף את המבחן האמיתי: 65 שאלות ב-2 שע' 10 דק', עם אותו סף מעבר של 720 / 1000. מצב עיון מאפשר לך לקרוא כל שאלה ותשובה באופן סטטי.