AWS Data Engineer Associate (DEA-C01): האם ההסמכה החדשה שווה את זה?
AWS השיקה את DEA-C01 במרץ 2024 כדי למלא את הפער בין תפקידי ניתוח נתונים להנדסת ענן. הנה האם זה שווה את זמנכם.
DEA-C01 שווה את זה אם אתם בונים צינורות נתונים (data pipelines) ב-AWS כמקצוע. לכל השאר — מהנדסי ענן כלליים, אנליסטים של BI, מדעני נתונים הנוגעים מדי פעם בתשתיות — SAA-C03 היא ההסמכה השימושית יותר, ולא תפסידו הרבה אם תדלגו על DEA-C01.
זו התשובה הקצרה. התשובה הארוכה יותר כוללת הבנה מדוע AWS השיקה הסמכה זו מלכתחילה, מה היא החליפה, ומהי הנישה התעסוקתית הספציפית באופן מפתיע שהיא משרתת.
מה החליף את מה
AWS הוציאה משימוש את ה-Data Analytics Specialty (DAS-C01) באפריל 2024, במקביל להשקת DEA-C01 במרץ 2024. אלו אינן אותן בחינות. ה-Data Analytics Specialty הייתה בחינת התמחות (specialty-tier) בעלות של 300 דולר ארה"ב, והתמקדה יותר בכלי אנליטיקה — QuickSight, Athena, Lake Formation, Kinesis Data Analytics. ה-DEA-C01 היא בחינת רמת Associate (associate-tier) בעלות של 150 דולר ארה"ב, והיא נוטה לכיוון כלי הנדסה — Glue, EMR, DMS, Step Functions, וכלל ערימת התיאום וההטמעה (orchestration and ingestion stack).
השינוי תואם את השוק. משרות "מנתח נתונים" (Data analyst) שדרשו הפעלת SQL מול אשכול Redshift נבלעו כבר שנים על ידי כלי BI בשירות עצמי (self-service BI tools) ואנליטיקה בסיוע למידת מכונה (ML-assisted analytics). משרות "מהנדס נתונים" (Data engineer) — בניית צינורות הנתונים, ה-lakehouse, והטמעת נתונים בזרם (streaming ingestion) — צמחו. AWS התאימה את תיק ההסמכות בהתאם.
אם החזקתם ב-DAS-C01 והיא פגה, אינכם זכאים אוטומטית ל-DEA-C01. עליכם לגשת לבחינה החדשה. AWS לא ציינה אם תבצע העברות הכרה; בהתבסס על האופן שבו טיפלו בשינוי השם של SOA (ללא העברה, יש לגשת לבחינה החדשה אם רוצים את התג החדש), אני מניח שלא.
מה נבדק
ארבעה תחומים:
- הטמעה וטרנספורמציה של נתונים (Data Ingestion and Transformation) (34%)
- ניהול אחסון נתונים (Data Store Management) (26%)
- תפעול ותמיכה בנתונים (Data Operations and Support) (22%)
- אבטחה וממשל נתונים (Data Security and Governance) (18%)
משקל התחומים הזה משמעותי. הטמעה וטרנספורמציה הם ללא ספק הפרוסה הגדולה ביותר. AWS לא בוחנת אם אתם יכולים לבחור את כלי ה-BI הנכון — הם בוחנים אם אתם יכולים לבנות את צנרת הנתונים (data plumbing).
שירותים ספציפיים המופיעים בכבדות:
AWS Glue. Crawlers, jobs, ה-Data Catalog, DataBrew, Glue Studio, Glue Streaming. כנראה 8–10 שאלות תלויות ב-Glue לבדו. עליכם לדעת את ההבדל בין Glue Spark jobs ל-Glue Python Shell jobs, מתי להשתמש ב-Glue Studio לעומת PySpark שנכתב ידנית, וכיצד ה-Data Catalog מתקשר עם Athena ו-Redshift Spectrum.
Amazon Athena. תבניות שאילתה (Query patterns), חלוקה למחיצות (partitioning), שאילתות מאוחדות (federated queries), קבוצות עבודה (workgroups), CTAS, מטמון תוצאות שאילתה (query result caching). Athena היא ברירת המחדל הזולה-מהירה-גמישה לשאילתות אד-הוק של נתוני S3, והבחינה בודקת אם אתם מכירים את מגבלותיה ומודל התמחור שלה.
EMR. EMR on EC2 לעומת EMR Serverless לעומת EMR on EKS. Spark, Hive, Presto, Trino, HBase. קביעת גודל אשכול (cluster sizing) וסוגי מופעים (instance types). הבחינה מתמקדת ב-EMR בכבדות, בין השאר מכיוון ש-AWS רוצה להבדיל אותו מ-Glue (Glue עבור ETL ללא שרתים, EMR עבור אקוסיסטם קוד פתוח של Big Data עם יותר שליטה).
Amazon Kinesis. Data Streams, Data Firehose (לשעבר Kinesis Data Firehose), Data Analytics for Apache Flink (לשעבר Kinesis Data Analytics). חישובי Shard, חלונות שמירה (retention windows), ההבדל בין Streams ל-Firehose. סטרימינג הוא חלק משמעותי מתחום ההטמעה.
Amazon Redshift. סוגי אשכולות (Cluster types), RA3 לעומת DC2, Redshift Serverless, Redshift Spectrum, תצוגות ממוחזרות (materialized views), מפתחות הפצה (distribution keys), מפתחות מיון (sort keys), VACUUM ו-ANALYZE. כוונון ביצועים ברמת הטבלה.
AWS DMS (Database Migration Service). Full load לעומת CDC, שכפול מתמשך (ongoing replication), נקודות קצה של מקור ויעד (source and target endpoints), DMS Schema Conversion. דגש חזק על תרחישי הגירה.
AWS Lake Formation. הרשאות (Permissions), טבלאות מנוהלות (governed tables), בקרת גישה מדוקדקת (fine-grained access control) על ה-Data Catalog. תחום האבטחה והממשל (Security and Governance) נשען על זה.
Step Functions, EventBridge, Lambda. תיאום (Orchestration) ותבניות מונעות אירועים (event-driven patterns). עומק פחות מזה של DVA-C02, אך מספיק כדי לזהות את כלי התיאום הנכון עבור צינור נתונים נתון.
רמות אחסון S3 ומדיניות מחזור חיים (lifecycle policies) לעומסי עבודה אנליטיים. תוכן זהה ל-SAA-C03, מיושם על תרחישי הנדסת נתונים.
מה לא נבדק לעומק: SageMaker (זהו התחום של MLA-C01), QuickSight (כיסוי קל יותר מזה שהיה ב-DAS-C01), תבניות הסקה של למידת מכונה בזמן אמת (real-time ML inference patterns), פנימיות עמוקות של Spark.
מי מרוויח הכי הרבה
מהנדסי נתונים המריצים צינורות ETL ב-AWS. זהו המקרה הברור. אם עבודתכם היומיומית היא כתיבת Glue jobs, ניהול Redshift warehouses, בניית הטמעת Kinesis, או העברת נתונים באמצעות DMS, תוכן ההסמכה מתאים ישירות לתפקידכם. לימוד לקראת DEA-C01 יחשוף פערים בשירותים שאולי לא נגעתם בהם (רוב מהנדסי הנתונים מכירים את Glue ו-Redshift היטב אך חלשים ב-Lake Formation או DataZone).
מהנדסי Backend המעברים לכיוון הנדסת נתונים. אם אתם מהנדסי תוכנה עם ניסיון ב-AWS המנסים להיכנס לתפקיד של מהנדס נתונים, DEA-C01 היא איתות אמין שאתם מבינים את האקוסיסטם. זו הסמכה ממוקדת יותר מ-SAA-C03 למנהלי גיוס המחפשים באופן ספציפי מהנדסי נתונים.
יועצים בחברות שותפות של AWS (AWS Partner companies) עם התמחות בנתונים. חברות ייעוץ זקוקות לעובדים מוסמכים בתחומים ספציפיים לצורך זכאות לרמת שותף (partner-tier). DEA-C01 ממלאה את משבצת ההתמחות בהנדסת נתונים.
מי צריך לדלג עליה
מהנדסי ענן כלליים / DevOps. אם אינכם עובדים על צינורות נתונים באופן ספציפי, תוכן ההסמכה צר מדי מכדי להיות שווה 80–120 שעות הכנה. SAA-C03 מכסה שטח שירותים רחב יותר והיא מוכרת יותר.
מדעני נתונים / מהנדסי למידת מכונה (ML engineers). ערכת הכלים שלכם היא SageMaker, MLflow, צינורות אימון, פריסת מודלים. ל-AWS יש הסמכות נפרדות לעבודה זו — MLA-C01 (Machine Learning Engineer Associate) ו-AIF-C01 (AI Practitioner). DEA-C01 אינה מיושרת עם מה שאתם עושים.
כל מי ששוקל אותה כ"הסמכת AWS ראשונה". DEA-C01 היא ברמת Associate. היא מניחה שאתם כבר מכירים את יסודות AWS — IAM, VPC, S3, Lambda — ברמת CLF-C02. כניסה "קרה" קשה. קחו קודם CLF-C02 אם אין לכם את אוצר המילים, או SAA-C03 אם אתם רוצים יסוד רחב יותר.
שוק העבודה ומשכורת
שכר מהנדסי נתונים היה אחד החלקים האגרסיביים ביותר בשוק הנתונים בין השנים 2024–2026. נתוני levels.fyi עבור תפקידי "מהנדס נתונים" מצביעים על שכר בסיס בארה"ב של 115 אלף עד 185 אלף דולר עבור משרות ביניים, כאשר תפקידים בכירים מגיעים ל-160 אלף עד 230 אלף דולר שכר בסיס במטרופולינים טכנולוגיים. שכר כולל בחברות טכנולוגיה גדולות (מהנדסי נתונים ב-Amazon L5/L6, מהנדסי נתונים ב-Meta E5/E6) עולה באופן שגרתי על 300 אלף דולר.
נתוני BLS OEWS של ארה"ב ממאי 2024 מסווגים מהנדסי נתונים תחת "מנהלי ומארכיטקטי מסדי נתונים" (Database Administrators and Architects) (15-1245), עם ממוצע חציוני של כ-103 אלף דולר, ואחוזון 90 סביב 164 אלף דולר. נתון זה לא משקף במדויק את מהנדסי הנתונים ב-AWS ספציפית מכיוון שה-BLS כולל בו גם תפקידי DBA מורשתיים.
DEA-C01 חדשה מדי מכדי שיהיו לה נתוני איתות משכורת משמעותיים משלה. באופן אנקדוטלי, בעלי ההסמכה מדווחים על עליות צנועות בתהליך הראיונות (יותר מגייסים יוצרים קשר, המרה מהירה יותר מסינון לראיון פרונטלי) אך ללא הבדל שכר עקבי לעומת מהנדסי נתונים לא מוסמכים עם ניסיון דומה. ההסמכה בת ארבעה עשר חודשים בלבד נכון לאפריל 2026; ייקח עוד שנה או שנתיים עד שהיא תופיע בבירור בנתוני שכר.
ערך הקריירה של ההסמכה נוגע יותר לבהירות התפקיד מאשר לשכר. היא מאותתת שאתם בונים במיוחד צינורות נתונים, מה שעוזר לכם להסתנן למודעות הדרושים הנכונות במקום להגיש מועמדות באופן רחב עם SAA-C03 ולקבל התאמה לתפקידי אדריכלות שאינכם רוצים.
זמן לימוד והכנה
טווח זמן סטנדרטי להסמכת AWS ברמת Associate: 80–150 שעות. DEA-C01 נוטה באופן ספציפי להיות בקצה העליון של הטווח מכיוון שמשטח השירותים רחב וכמה שירותים (Glue, Lake Formation, EMR Serverless) מורכבים תפעולית מספיק כך שקריאה עליהם אינה מספיקה — עליכם להשתמש בהם.
מסלול הכנה מוצע:
- שבועות 1–3: תוכנית הלימודים של Data Engineer ב-AWS Skill Builder (כיסוי חינמי הוגן), בתוספת קריאת תיעוד AWS Glue, Athena ו-Redshift. אל תדלגו על התיעוד. הבחינה שואלת שאלות ספציפיות על פרמטרים של Glue job ומפתחות הפצה של Redshift המתועדים אך לא תמיד מכוסים בהכנה מצד ג'.
- שבועות 4–6: התנסות מעשית. בנו צינור נתונים מקצה לקצה (end-to-end pipeline). הטמיעו נתונים מזרם Kinesis ל-S3 באמצעות Firehose, סרקו אותם עם Glue, שאלו אותם עם Athena, הפכו אותם עם Glue ETL job, טענו אותם ל-Redshift. גם בקנה מידה קטן, ביצוע פעולה זו פעם אחת מלמד יותר מקריאה עליה שלוש פעמים.
- שבועות 7–8: תרגול תרחישים. עיינו במאגר השאלות של DEA-C01 ב-CertLabPro לתרגול בחינות מתוזמן. כוונו לשני ציוני תרגול עוקבים של 80%+ לפני קביעת מועד הבחינה.
השורה התחתונה
DEA-C01 היא הסמכת נישה המשרתת נישה אמיתית וצומחת. אם אתם כבר מהנדסי נתונים או רוצים להיות כאלה, קחו אותה. אם אינכם בטוחים אם אתם רוצים להתמחות בהנדסת נתונים עדיין, קחו קודם את SAA-C03 — היא מוכרת יותר, כללית יותר, ותוכלו לחזור ל-DEA-C01 מאוחר יותר אם ההתמחות תהיה הגיונית.
ההסמכה חדשה מדי עבור הצהרות שכר בטוחות, וכל מי שאומר לכם שהיא תוסיף 20 אלף דולר לשכרכם מנחש. ההצעה הכנה היא: זו הסמכה תקפה, מאושרת על ידי AWS, לתפקיד המגייס בעוצמה עד 2026. זה מספיק.