AWS Data Engineer Associate (DEA-C01): стоит ли новая сертификация того?
AWS запустила DEA-C01 в марте 2024 года, чтобы восполнить пробел между ролями аналитика данных и облачной инженерией. Вот стоит ли она вашего времени.
DEA-C01 стоит того, если вы занимаетесь построением конвейеров данных на AWS. Для всех остальных — облачных инженеров-универсалов, BI-аналитиков, специалистов по данным, которые лишь изредка касаются инфраструктуры — SAA-C03 является более полезным сертификатом, и вы не так уж много потеряете, пропустив DEA-C01.
Это краткий ответ. Более полный ответ включает понимание того, почему AWS вообще запустила эту сертификацию, что она заменила, и какую удивительно специфическую карьерную нишу она обслуживает.
Что заменило что
AWS прекратила действие сертификации Data Analytics Specialty (DAS-C01) в апреле 2024 года, одновременно запустив DEA-C01 в марте 2024 года. Это не один и тот же экзамен. Data Analytics Specialty был сертификатом уровня Specialty (300 USD) и больше ориентировался на аналитические инструменты — QuickSight, Athena, Lake Formation, Kinesis Data Analytics. DEA-C01 — это сертификат уровня Associate (150 USD) и он больше ориентирован на инженерные инструменты — Glue, EMR, DMS, Step Functions, а также на стек для оркестрации и приёма данных.
Этот сдвиг соответствует рынку. Рабочие места "аналитика данных", которые требовали запуска SQL-запросов к кластеру Redshift, годами поглощались инструментами самообслуживания BI и аналитикой с поддержкой машинного обучения. Количество вакансий "инженера данных" — по построению конвейеров, lakehouse, потоковой загрузки — выросло. AWS скорректировала портфель сертификаций в соответствии с этим трендом.
Если у вас был DAS-C01 и срок его действия истёк, вы не будете автоматически переведены на DEA-C01. Вам придётся сдавать новый экзамен. AWS не сообщила, будут ли они осуществлять перенос признания; исходя из того, как они поступили с переименованием SOA (без переноса, сдайте новый экзамен, если хотите получить новый значок), я бы предположил, что нет.
Что проверяется
Четыре области:
- Приём и Трансформация Данных (34%)
- Управление Хранилищами Данных (26%)
- Операции и Поддержка Данных (22%)
- Безопасность и Управление Данными (18%)
Этот вес областей значим. Приём и Трансформация — безусловно, самый большой сегмент. AWS проверяет не то, можете ли вы выбрать подходящий BI-инструмент — они проверяют, можете ли вы построить систему передачи данных.
Особо часто встречающиеся сервисы:
AWS Glue. Crawlers, задания (jobs), Data Catalog, DataBrew, Glue Studio, Glue Streaming. Вероятно, 8–10 вопросов зависят исключительно от Glue. Вам нужно знать разницу между Glue Spark jobs и Glue Python Shell jobs, когда использовать Glue Studio по сравнению с написанным вручную PySpark, и как Data Catalog взаимодействует с Athena и Redshift Spectrum.
Amazon Athena. Шаблоны запросов, партиционирование, федеративные запросы, рабочие группы (workgroups), CTAS, кеширование результатов запросов. Athena — это дешёвый, быстрый и гибкий стандарт для нерегламентированных запросов к данным S3, и экзамен проверяет, знаете ли вы её ограничения и модель ценообразования.
EMR. EMR on EC2 vs EMR Serverless vs EMR on EKS. Spark, Hive, Presto, Trino, HBase. Определение размера кластера и типы экземпляров. Экзамен уделяет большое внимание EMR, отчасти потому, что AWS хочет отличить его от Glue (Glue для бессерверного ETL, EMR для экосистемы больших данных с открытым исходным кодом с большим контролем).
Amazon Kinesis. Data Streams, Data Firehose (ранее Kinesis Data Firehose), Data Analytics for Apache Flink (ранее Kinesis Data Analytics). Расчёт шардов, окна хранения, разница между Streams и Firehose. Потоковая передача данных является значительной частью области приёма данных.
Amazon Redshift. Типы кластеров, RA3 vs DC2, Redshift Serverless, Redshift Spectrum, материализованные представления, ключи распределения (distribution keys), ключи сортировки (sort keys), VACUUM и ANALYZE. Оптимизация производительности на уровне таблицы.
AWS DMS (Database Migration Service). Полная загрузка vs CDC, непрерывная репликация, исходные и целевые конечные точки, DMS Schema Conversion. Большой акцент на сценарии миграции.
AWS Lake Formation. Разрешения, управляемые таблицы, детальный контроль доступа к Data Catalog. Область безопасности и управления опирается на этот сервис.
Step Functions, EventBridge, Lambda. Оркестрация и событийные паттерны. Меньше глубины, чем в покрытии DVA-C02, но достаточно, чтобы распознать правильный инструмент оркестрации для данного конвейера.
Уровни хранения S3 и политики жизненного цикла для аналитических рабочих нагрузок. Тот же контент, что и в SAA-C03, применённый к сценариям инженерии данных.
Что не проверяется глубоко: SageMaker (это территория MLA-C01), QuickSight (менее глубокое покрытие, чем было в DAS-C01), паттерны вывода ML в реальном времени, глубокие внутренние механизмы Spark.
Кому это наиболее выгодно
Инженеры данных, развёртывающие ETL-конвейеры на AWS. Это очевидный случай. Если ваша повседневная работа — написание заданий Glue, управление хранилищами Redshift, построение загрузки данных Kinesis или миграция баз данных через DMS, содержание сертификации напрямую соответствует вашей работе. Изучение DEA-C01 выявит пробелы в сервисах, с которыми вы, возможно, не сталкивались (большинство инженеров данных хорошо знают Glue и Redshift, но слабы в Lake Formation или DataZone).
Бэкенд-инженеры, переходящие в инженерию данных. Если вы программный инженер с опытом работы с AWS, пытающийся перейти на роль инженера данных, DEA-C01 является надёжным сигналом того, что вы понимаете экосистему. Это более целенаправленная сертификация, чем SAA-C03, для менеджеров по найму, ищущих именно инженеров данных.
Консультанты в компаниях-партнёрах AWS с практикой работы с данными. Консалтинговым фирмам требуются сертифицированные сотрудники в определённых областях для соответствия требованиям партнёрского уровня. DEA-C01 заполняет нишу специализации в области инженерии данных.
Кому стоит пропустить
Облачные инженеры-универсалы / DevOps. Если вы не работаете конкретно с конвейерами данных, содержание сертификации слишком узко, чтобы тратить на подготовку 80–120 часов. SAA-C03 охватывает более широкий спектр сервисов и более признан.
Специалисты по данным / ML-инженеры. Ваш инструментарий — SageMaker, MLflow, конвейеры обучения, развёртывание моделей. У AWS есть отдельные сертификаты для этой работы — MLA-C01 (Machine Learning Engineer Associate) и AIF-C01 (AI Practitioner). DEA-C01 не соответствует тому, чем вы занимаетесь.
Любой, кто рассматривает её как "первую сертификацию AWS". DEA-C01 относится к уровню Associate. Она предполагает, что вы уже знаете основы AWS — IAM, VPC, S3, Lambda — на уровне CLF-C02. Начинать с нуля будет сложно. Сдайте CLF-C02 сначала, если у вас нет базовых знаний, или SAA-C03, если вы хотите получить более широкую основу.
Рынок труда и зарплата
Вознаграждение в сфере инженерии данных было одной из наиболее динамичных частей рынка данных в период 2024–2026 годов. Данные levels.fyi для ролей "инженера данных" показывают базовую зарплату в США на уровне $115k–$185k для среднего уровня, а для старших ролей — $160k–$230k в метрополиях с развитыми технологиями. Общая компенсация в крупных технологических компаниях (инженеры данных Amazon L5/L6, Meta E5/E6) регулярно превышает $300k.
Данные U.S. BLS OEWS за май 2024 года классифицируют инженеров данных как "Администраторов и архитекторов баз данных" (15-1245), медианная зарплата около $103k, 90-й процентиль около $164k. Эти данные недооценивают конкретно инженеров данных AWS, потому что BLS объединяет их с устаревшими ролями DBA.
DEA-C01 слишком нова, чтобы иметь значимые данные о влиянии на зарплату. По неофициальным данным, обладатели сертификации сообщают о скромном ускорении процесса интервью (больше рекрутеров обращаются, более быстрая конверсия от первичного отбора до собеседования на месте), но без последовательной разницы в зарплате по сравнению с несертифицированными инженерами данных с аналогичным опытом. Сертификации всего четырнадцать месяцев по состоянию на апрель 2026 года; потребуется ещё год или два, прежде чем она чётко проявится в данных о компенсациях.
Ценность сертификации для карьеры заключается скорее в ясности роли, чем в зарплате. Она сигнализирует, что вы специализируетесь на построении конвейеров данных, что помогает вам быть отобранным для правильных вакансий вместо широкого применения с SAA-C03 и получения предложений на роли архитектора, которые вам не нужны.
Время на обучение и подготовку
Стандартное время для уровня AWS Associate: 80–150 часов. DEA-C01, в частности, обычно требует больше времени, потому что охват сервисов широк, а некоторые сервисы (Glue, Lake Formation, EMR Serverless) достаточно сложны в эксплуатации, так что простого чтения о них недостаточно — их нужно использовать.
Рекомендуемый план подготовки:
- Недели 1–3: План обучения Data Engineer от AWS Skill Builder (достойное бесплатное покрытие), а также чтение документации AWS Glue, Athena и Redshift. Не пропускайте документацию. На экзамене задаются конкретные вопросы о параметрах заданий Glue и ключах распределения Redshift, которые задокументированы, но не всегда охватываются в сторонних материалах для подготовки.
- Недели 4–6: практическая работа. Постройте сквозной конвейер. Загрузите данные из потока Kinesis в S3 через Firehose, проиндексируйте их с помощью Glue, запросите с помощью Athena, трансформируйте с помощью задания Glue ETL, загрузите в Redshift. Даже в малом масштабе однократное выполнение этого научит вас большему, чем трёхкратное чтение об этом.
- Недели 7–8: практика сценариев. Просмотрите банк вопросов DEA-C01 на CertLabPro для тренировки в условиях ограниченного времени экзамена. Стремитесь к двум последовательным результатам 80%+ на практических тестах, прежде чем записываться на экзамен.
Итог
DEA-C01 — это нишевая сертификация, обслуживающая реальную и растущую нишу. Если вы уже инженер данных или хотите им стать, сдавайте её. Если вы ещё не уверены, хотите ли вы специализироваться на инженерии данных, сначала сдайте SAA-C03 — она более признана, более общая, и вы можете вернуться к DEA-C01 позже, если специализация будет иметь смысл.
Сертификация слишком нова для уверенных заявлений о зарплате, и любой, кто говорит вам, что она добавит $20k к вашей компенсации, просто гадает. Честное заявление таково: это действующая, одобренная AWS квалификация для роли, которая активно набирает персонал до 2026 года. Этого достаточно.