AWS Data Engineer Associate (DEA-C01): क्या नया सर्टिफिकेशन इसके लायक है?
AWS ने मार्च 2024 में DEA-C01 लॉन्च किया ताकि डेटा एनालिटिक्स भूमिकाओं और क्लाउड इंजीनियरिंग के बीच के अंतर को भरा जा सके। यहाँ बताया गया है कि क्या यह आपके समय के लायक है।
DEA-C01 इसके लायक है यदि आप AWS पर डेटा पाइपलाइन बनाने का काम करते हैं। बाकी सभी के लिए — सामान्य क्लाउड इंजीनियर, BI विश्लेषक, डेटा वैज्ञानिक जो कभी-कभार इन्फ्रा को छूते हैं — SAA-C03 अधिक उपयोगी क्रेडेंशियल है, और DEA-C01 को छोड़कर आप वास्तव में कुछ खास नहीं चूक रहे हैं।
यह संक्षिप्त उत्तर है। लंबा उत्तर यह समझने में शामिल है कि AWS ने यह सर्टिफिकेशन क्यों लॉन्च किया, इसने किसे बदला, और यह किस आश्चर्यजनक रूप से विशिष्ट करियर क्षेत्र की सेवा करता है।
किसने किसको बदला
AWS ने अप्रैल 2024 में Data Analytics Specialty (DAS-C01) को बंद कर दिया, साथ ही मार्च 2024 में DEA-C01 लॉन्च किया। वे एक ही परीक्षा नहीं हैं। Data Analytics Specialty एक विशेषज्ञ-स्तरीय ($300 USD) था और एनालिटिक्स-साइड टूल्स — QuickSight, Athena, Lake Formation, Kinesis Data Analytics पर अधिक निर्भर करता था। DEA-C01 सहयोगी-स्तरीय ($150 USD) है और इंजीनियरिंग-साइड टूल्स — Glue, EMR, DMS, Step Functions, ऑर्केस्ट्रेशन और इन्जेक्शन स्टैक की ओर झुका है।
यह बदलाव बाजार से मेल खाता है। "डेटा विश्लेषक" की नौकरियां, जिनमें किसी को Redshift क्लस्टर के खिलाफ SQL चलाने की आवश्यकता होती थी, वर्षों से स्व-सेवा BI टूल्स और ML-सहायता प्राप्त एनालिटिक्स द्वारा समाहित की जा रही हैं। "डेटा इंजीनियर" की नौकरियां — पाइपलाइन, लेकहाउस, स्ट्रीमिंग इन्जेक्शन का निर्माण — बढ़ी हैं। AWS ने इसी के अनुसार सर्टिफिकेशन पोर्टफोलियो को समायोजित किया।
यदि आपके पास DAS-C01 था और वह समाप्त हो गया, तो आपको स्वतः ही DEA-C01 में शामिल नहीं किया जाएगा। आपको नई परीक्षा देनी होगी। AWS ने यह नहीं बताया है कि वे मान्यता हस्तांतरण करेंगे या नहीं; जिस तरह से उन्होंने SOA के नाम बदलने को संभाला (कोई हस्तांतरण नहीं, यदि आप नया बैज चाहते हैं तो नई परीक्षा पास करें), उसके आधार पर मैं मानूंगा कि नहीं।
क्या परीक्षण किया जाता है
चार डोमेन:
- डेटा इन्जेक्शन और परिवर्तन (34%)
- डेटा स्टोर प्रबंधन (26%)
- डेटा ऑपरेशंस और सपोर्ट (22%)
- डेटा सुरक्षा और शासन (18%)
यह डोमेन भार महत्वपूर्ण है। इन्जेक्शन और परिवर्तन अब तक का सबसे बड़ा हिस्सा है। AWS यह परीक्षण नहीं कर रहा है कि आप सही BI टूल चुन सकते हैं या नहीं — वे यह परीक्षण कर रहे हैं कि क्या आप डेटा पाइपलाइनिंग का निर्माण कर सकते हैं।
प्रमुखता से दिखाई देने वाली विशिष्ट सेवाएं:
AWS Glue। Crawlers, jobs, Data Catalog, DataBrew, Glue Studio, Glue Streaming। संभवतः 8-10 प्रश्न अकेले Glue पर आधारित होते हैं। आपको Glue Spark jobs और Glue Python Shell jobs के बीच का अंतर जानने की आवश्यकता है, Glue Studio का उपयोग कब करना है बनाम हाथ से लिखे PySpark का, और Data Catalog Athena और Redshift Spectrum के साथ कैसे इंटरैक्ट करता है।
Amazon Athena। Query patterns, partitioning, federated queries, workgroups, CTAS, query result caching। Athena S3 डेटा की एड-हॉक क्वेरी के लिए सस्ता-तेज-लचीला डिफ़ॉल्ट है, और परीक्षा यह परीक्षण करती है कि क्या आप इसकी सीमाओं और मूल्य निर्धारण मॉडल को जानते हैं।
EMR। EMR on EC2 बनाम EMR Serverless बनाम EMR on EKS। Spark, Hive, Presto, Trino, HBase। Cluster sizing और instance types। परीक्षा EMR को काफी महत्व देती है, आंशिक रूप से क्योंकि AWS इसे Glue से अलग करना चाहता है (Glue सर्वरलेस ETL के लिए, EMR अधिक नियंत्रण के साथ ओपन-सोर्स बिग-डेटा इकोसिस्टम के लिए)।
Amazon Kinesis। Data Streams, Data Firehose (पहले Kinesis Data Firehose), Data Analytics for Apache Flink (पहले Kinesis Data Analytics)। Shard math, retention windows, Streams और Firehose के बीच का अंतर। स्ट्रीमिंग इन्जेक्शन डोमेन का एक महत्वपूर्ण हिस्सा है।
Amazon Redshift। Cluster types, RA3 बनाम DC2, Redshift Serverless, Redshift Spectrum, materialized views, distribution keys, sort keys, VACUUM और ANALYZE। टेबल स्तर पर परफॉर्मेंस ट्यूनिंग।
AWS DMS (Database Migration Service)। Full load बनाम CDC, ongoing replication, source और target endpoints, DMS Schema Conversion। माइग्रेशन परिदृश्यों पर अधिक जोर।
AWS Lake Formation। Permissions, governed tables, Data Catalog पर फाइन-ग्रेन्ड एक्सेस कंट्रोल। Security and Governance डोमेन इस पर निर्भर करता है।
Step Functions, EventBridge, Lambda। Orchestration और event-driven patterns। DVA-C02 की कवरेज से कम गहराई, लेकिन किसी दिए गए पाइपलाइन के लिए सही ऑर्केस्ट्रेशन टूल को पहचानने के लिए पर्याप्त।
एनालिटिक्स वर्कलोड के लिए S3 storage tiers और lifecycle policies। SAA-C03 के समान सामग्री, डेटा-इंजीनियरिंग परिदृश्यों पर लागू।
क्या गहराई से परीक्षण नहीं किया जाता है: SageMaker (यह MLA-C01 का क्षेत्र है), QuickSight (DAS-C01 की तुलना में हल्की कवरेज), real-time ML inference patterns, deep Spark internals।
सबसे अधिक किसे लाभ होता है
AWS पर ETL पाइपलाइन बनाने वाले डेटा इंजीनियर। यह स्पष्ट मामला है। यदि आपका दैनिक कार्य Glue jobs लिखना, Redshift वेयरहाउस का प्रबंधन करना, Kinesis इन्जेक्शन बनाना, या DMS के माध्यम से डेटाबेस माइग्रेट करना है, तो सर्टिफिकेशन सामग्री सीधे आपके काम से मेल खाती है। DEA-C01 के लिए अध्ययन करने से उन सेवाओं में कमियां उजागर होंगी जिन्हें आपने शायद छुआ नहीं है (अधिकांश डेटा इंजीनियर Glue और Redshift को अच्छी तरह जानते हैं लेकिन Lake Formation या DataZone पर कमजोर होते हैं)।
डेटा इंजीनियरिंग की ओर रुख करने वाले बैकएंड इंजीनियर। यदि आप AWS अनुभव वाले सॉफ्टवेयर इंजीनियर हैं और डेटा इंजीनियरिंग भूमिका में आना चाहते हैं, तो DEA-C01 एक विश्वसनीय संकेत है कि आप इकोसिस्टम को समझते हैं। यह SAA-C03 की तुलना में डेटा इंजीनियरिंग हायर की तलाश करने वाले हायरिंग मैनेजर्स के लिए अधिक लक्षित क्रेडेंशियल है।
डेटा प्रथाओं वाली AWS पार्टनर कंपनियों के सलाहकार। कंसल्टेंसी को पार्टनर-टियर योग्यता के लिए विशिष्ट डोमेन में प्रमाणित कर्मचारियों की आवश्यकता होती है। DEA-C01 डेटा-इंजीनियरिंग विशेषज्ञता स्लॉट को भरता है।
किसे इसे छोड़ देना चाहिए
सामान्य क्लाउड इंजीनियर / DevOps। यदि आप विशेष रूप से डेटा पाइपलाइन पर काम नहीं करते हैं, तो सर्टिफिकेशन सामग्री 80-120 घंटे की तैयारी के लायक होने के लिए बहुत संकीर्ण है। SAA-C03 एक व्यापक सेवा सतह को कवर करता है और अधिक मान्यता प्राप्त है।
डेटा वैज्ञानिक / ML इंजीनियर। आपकी टूलचेन SageMaker, MLflow, प्रशिक्षण पाइपलाइन, मॉडल डिप्लॉयमेंट है। AWS के पास उस काम के लिए अलग सर्टिफिकेशन हैं — MLA-C01 (Machine Learning Engineer Associate) और AIF-C01 (AI Practitioner)। DEA-C01 आपके काम के साथ संरेखित नहीं है।
कोई भी जो इसे "पहले AWS सर्टिफिकेशन" के रूप में मान रहा है। DEA-C01 सहयोगी-स्तर का है। यह मानता है कि आप पहले से ही CLF-C02 स्तर पर AWS के मूल सिद्धांतों — IAM, VPC, S3, Lambda — को जानते हैं। बिना तैयारी के जाना मुश्किल है। यदि आपके पास शब्दावली नहीं है तो पहले CLF-C02 लें, या यदि आप एक व्यापक नींव चाहते हैं तो पहले SAA-C03 लें।
करियर बाजार और वेतन
2024-2026 के दौरान डेटा इंजीनियरिंग मुआवजा डेटा बाजार के अधिक आक्रामक हिस्सों में से एक रहा है। levels.fyi के "डेटा इंजीनियर" भूमिकाओं के डेटा के अनुसार, मध्य-स्तर के लिए अमेरिकी वेतन $115k–$185k आधार है, जिसमें टेक-हब मेट्रो में वरिष्ठ भूमिकाओं के लिए $160k–$230k आधार है। बड़ी तकनीकी कंपनियों (Amazon L5/L6 डेटा इंजीनियर, Meta E5/E6 डेटा इंजीनियर) में कुल मुआवजा नियमित रूप से $300k से अधिक होता है।
यू.एस. BLS OEWS मई 2024 डेटा डेटा इंजीनियरों को "Database Administrators and Architects" (15-1245) के तहत वर्गीकृत करता है, जिसमें औसत $103k, 90वां प्रतिशत $164k के आसपास है। यह विशेष रूप से AWS-डेटा-इंजीनियर को कम आंकता है क्योंकि BLS इसमें विरासत DBA भूमिकाओं को भी शामिल करता है।
DEA-C01 इतना नया है कि इसके अपने आप में कोई सार्थक वेतन संकेत डेटा नहीं है। उपाख्यानात्मक रूप से, धारक मामूली साक्षात्कार-पाइपलाइन वृद्धि (अधिक रिक्रूटरों का संपर्क करना, तेजी से स्क्रीन-टू-ऑनसाइट रूपांतरण) की रिपोर्ट कर रहे हैं, लेकिन समान अनुभव वाले गैर-प्रमाणित डेटा इंजीनियरों की तुलना में कोई सुसंगत वेतन अंतर नहीं है। अप्रैल 2026 तक सर्टिफिकेशन केवल चौदह महीने पुराना है; मुआवजे के डेटा में स्पष्ट रूप से दिखाई देने में इसे एक या दो साल और लगेंगे।
सर्टिफिकेशन का करियर मूल्य वेतन से अधिक भूमिका-स्पष्टता के बारे में है। यह संकेत देता है कि आप विशेष रूप से डेटा पाइपलाइन बनाते हैं, जो आपको SAA-C03 के साथ व्यापक रूप से आवेदन करने और उन आर्किटेक्ट भूमिकाओं से मेल खाने के बजाय सही नौकरी पोस्टिंग में फ़िल्टर होने में मदद करता है जिन्हें आप नहीं चाहते हैं।
अध्ययन का समय और तैयारी
मानक AWS सहयोगी अवधि: 80-150 घंटे। DEA-C01 विशेष रूप से उच्च अंत पर होता है क्योंकि सेवा सतह व्यापक है और कई सेवाएं (Glue, Lake Formation, EMR Serverless) परिचालन रूप से इतनी जटिल हैं कि उनके बारे में पढ़ना पर्याप्त नहीं है — आपको उनका उपयोग करना होगा।
सुझाई गई तैयारी की रूपरेखा:
- सप्ताह 1-3: AWS Skill Builder का Data Engineer लर्निंग प्लान (उचित मुफ्त कवरेज), साथ ही AWS Glue, Athena, और Redshift डॉक्यूमेंटेशन पढ़ना। डॉक्यूमेंटेशन को न छोड़ें। परीक्षा Glue job parameters और Redshift distribution keys के बारे में विशिष्ट प्रश्न पूछती है जो डॉक्यूमेंटेड हैं लेकिन हमेशा थर्ड-पार्टी तैयारी में शामिल नहीं होते हैं।
- सप्ताह 4-6: हैंड्स-ऑन। एक एंड-टू-एंड पाइपलाइन बनाएं। Firehose के माध्यम से Kinesis stream से S3 में डेटा इन्जेस्ट करें, इसे Glue से क्रॉल करें, इसे Athena से क्वेरी करें, इसे Glue ETL job से रूपांतरित करें, इसे Redshift में लोड करें। छोटे पैमाने पर भी, इसे एक बार करने से आपको इसके बारे में तीन बार पढ़ने से अधिक सीखने को मिलता है।
- सप्ताह 7-8: परिदृश्य अभ्यास। समयबद्ध परीक्षा अभ्यास के लिए CertLabPro पर DEA-C01 प्रश्न बैंक ब्राउज़ करें। शेड्यूल करने से पहले लगातार दो 80%+ अभ्यास स्कोर का लक्ष्य रखें।
निष्कर्ष
DEA-C01 एक विशिष्ट सर्टिफिकेशन है जो एक वास्तविक और बढ़ते हुए विशिष्ट क्षेत्र की सेवा करता है। यदि आप पहले से ही डेटा इंजीनियर हैं या बनना चाहते हैं, तो इसे लें। यदि आप अभी तक डेटा इंजीनियरिंग में विशेषज्ञता प्राप्त करना चाहते हैं या नहीं, इसके बारे में निश्चित नहीं हैं, तो पहले SAA-C03 लें — यह अधिक मान्यता प्राप्त, अधिक सामान्य है, और यदि विशेषज्ञता समझ में आती है तो आप बाद में DEA-C01 पर वापस आ सकते हैं।
सर्टिफिकेशन आत्मविश्वासपूर्ण वेतन दावों के लिए बहुत नया है, और कोई भी जो आपको बताता है कि यह आपके वेतन में $20k जोड़ देगा, वह अनुमान लगा रहा है। ईमानदार बात यह है: यह एक वैध, AWS-अनुमोदित क्रेडेंशियल है एक ऐसी भूमिका के लिए जो 2026 तक मजबूती से हायरिंग कर रही है। यह पर्याप्त है।