AWS Data Engineer Associate (DEA-C01): a nova certificação vale a pena?
A AWS lançou a DEA-C01 em março de 2024 para preencher a lacuna entre as funções de análise de dados e engenharia de nuvem. Veja se vale o seu tempo.
A DEA-C01 vale a pena se você constrói pipelines de dados na AWS profissionalmente. Para todos os outros — engenheiros de nuvem generalistas, analistas de BI, cientistas de dados que ocasionalmente interagem com infraestrutura — a SAA-C03 é a credencial mais útil, e você não perde muito ao pular a DEA-C01.
Essa é a resposta curta. A resposta mais longa envolve entender por que a AWS lançou essa certificação em primeiro lugar, o que ela substituiu e o nicho de carreira surpreendentemente específico que ela atende.
O que substituiu o quê
A AWS aposentou a Data Analytics Specialty (DAS-C01) em abril de 2024, ao mesmo tempo em que lançou a DEA-C01 em março de 2024. Eles não são o mesmo exame. A Data Analytics Specialty era de nível de especialidade (US$ 300) e se inclinava mais para ferramentas de análise — QuickSight, Athena, Lake Formation, Kinesis Data Analytics. A DEA-C01 é de nível associado (US$ 150) e se inclina para ferramentas de engenharia — Glue, EMR, DMS, Step Functions, o stack de orquestração e ingestão.
A mudança corresponde ao mercado. Trabalhos de "analista de dados" que exigiam que alguém executasse SQL em um cluster Redshift têm sido absorvidos por ferramentas de BI de autoatendimento e análise assistida por ML há anos. Os trabalhos de "engenheiro de dados" — construir os pipelines, o lakehouse, a ingestão de streaming — cresceram. A AWS ajustou o portfólio de certificações para acompanhar.
Se você possuía a DAS-C01 e ela expirou, você não é automaticamente transferido para a DEA-C01. Você precisa fazer o novo exame. A AWS não disse se fará transferências de reconhecimento; com base em como eles lidaram com a renomeação da SOA (sem transferência, passe no novo exame se quiser o novo distintivo), eu presumiria que não.
O que é testado
Quatro domínios:
- Ingestão e Transformação de Dados (34%)
- Gerenciamento de Armazenamento de Dados (26%)
- Operações e Suporte de Dados (22%)
- Segurança e Governança de Dados (18%)
Esse peso dos domínios é significativo. Ingestão e Transformação é, de longe, a maior fatia. A AWS não está testando se você consegue escolher a ferramenta de BI certa — eles estão testando se você consegue construir a "rede" de dados.
Serviços específicos que aparecem com frequência:
AWS Glue. Crawlers, jobs, o Data Catalog, DataBrew, Glue Studio, Glue Streaming. Provavelmente 8 a 10 perguntas dependem apenas do Glue. Você precisa saber a diferença entre Glue Spark jobs e Glue Python Shell jobs, quando usar Glue Studio versus PySpark escrito manualmente, e como o Data Catalog interage com Athena e Redshift Spectrum.
Amazon Athena. Padrões de consulta, particionamento, consultas federadas, workgroups, CTAS, cache de resultados de consulta. Athena é o padrão barato-rápido-flexível para consultas ad-hoc de dados no S3, e o exame testa se você conhece seus limites e modelo de precificação.
EMR. EMR on EC2 vs EMR Serverless vs EMR on EKS. Spark, Hive, Presto, Trino, HBase. Dimensionamento de clusters e tipos de instância. O exame foca bastante no EMR, em parte porque a AWS quer diferenciá-lo do Glue (Glue para ETL serverless, EMR para ecossistema de big data de código aberto com mais controle).
Amazon Kinesis. Data Streams, Data Firehose (anteriormente Kinesis Data Firehose), Data Analytics for Apache Flink (anteriormente Kinesis Data Analytics). Cálculo de shards, janelas de retenção, a diferença entre Streams e Firehose. Streaming é uma parte significativa do domínio de ingestão.
Amazon Redshift. Tipos de cluster, RA3 vs DC2, Redshift Serverless, Redshift Spectrum, visualizações materializadas, chaves de distribuição, chaves de ordenação, VACUUM e ANALYZE. Ajuste de desempenho no nível da tabela.
AWS DMS (Database Migration Service). Carga completa vs CDC, replicação contínua, endpoints de origem e destino, DMS Schema Conversion. Forte em cenários de migração.
AWS Lake Formation. Permissões, tabelas governadas, controle de acesso granular sobre o Data Catalog. O domínio de Segurança e Governança se baseia nisso.
Step Functions, EventBridge, Lambda. Padrões de orquestração e baseados em eventos. Menos profundidade do que a cobertura da DVA-C02, mas suficiente para reconhecer a ferramenta de orquestração certa para um determinado pipeline.
Camadas de armazenamento S3 e políticas de ciclo de vida para workloads de análise. Mesmo conteúdo da SAA-C03, aplicado a cenários de engenharia de dados.
O que não é profundamente testado: SageMaker (território do MLA-C01), QuickSight (cobertura mais leve do que o DAS-C01 tinha), padrões de inferência de ML em tempo real, internos profundos do Spark.
Quem mais se beneficia
Engenheiros de dados que entregam pipelines ETL na AWS. Este é o caso óbvio. Se seu trabalho diário é escrever jobs do Glue, gerenciar warehouses do Redshift, construir ingestão via Kinesis ou migrar bancos de dados via DMS, o conteúdo da certificação se alinha diretamente com seu trabalho. Estudar para a DEA-C01 irá revelar lacunas em serviços que você talvez não tenha tocado (a maioria dos engenheiros de dados conhece Glue e Redshift profundamente, mas são fracos em Lake Formation ou DataZone).
Engenheiros de backend migrando para engenharia de dados. Se você é um engenheiro de software com experiência em AWS tentando entrar em uma função de engenharia de dados, a DEA-C01 é um sinal credível de que você entende o ecossistema. É uma credencial mais direcionada do que a SAA-C03 para gerentes de contratação que procuram especificamente por engenheiros de dados.
Consultores em empresas Parceiras da AWS com práticas de dados. Consultorias precisam de funcionários certificados em domínios específicos para elegibilidade de nível de parceria. A DEA-C01 preenche a vaga de especialização em engenharia de dados.
Quem deve pular
Engenheiros de nuvem generalistas / DevOps. Se você não trabalha especificamente com pipelines de dados, o conteúdo da certificação é muito restrito para valer 80 a 120 horas de preparação. A SAA-C03 cobre uma superfície de serviço mais ampla e é mais reconhecida.
Cientistas de dados / Engenheiros de ML. Sua toolchain é SageMaker, MLflow, pipelines de treinamento, implantação de modelos. A AWS tem certificações separadas para esse trabalho — MLA-C01 (Machine Learning Engineer Associate) e AIF-C01 (AI Practitioner). A DEA-C01 não está alinhada com o que você faz.
Qualquer pessoa que a considere como uma "primeira certificação AWS". A DEA-C01 é de nível associado. Ela pressupõe que você já conhece os fundamentos da AWS — IAM, VPC, S3, Lambda — no nível CLF-C02. Entrar sem preparo é difícil. Faça a CLF-C02 primeiro se você não tiver o vocabulário, ou a SAA-C03 primeiro se você quiser uma base mais ampla.
Mercado de carreira e salário
A remuneração em engenharia de dados tem sido uma das partes mais agressivas do mercado de dados entre 2024 e 2026. Dados do levels.fyi para funções de "Engenheiro de Dados" indicam uma remuneração base nos EUA de US$ 115 mil a US$ 185 mil para nível médio, com funções sêniores de US$ 160 mil a US$ 230 mil de base em grandes centros de tecnologia. A remuneração total em grandes empresas de tecnologia (engenheiros de dados Amazon L5/L6, Meta E5/E6) rotineiramente excede US$ 300 mil.
Os dados do BLS OEWS dos EUA de maio de 2024 classificam os engenheiros de dados sob "Administradores e Arquitetos de Banco de Dados" (15-1245), com uma mediana de cerca de US$ 103 mil e o percentil 90 em torno de US$ 164 mil. Isso subestima especificamente o engenheiro de dados da AWS porque o BLS agrupa funções de DBA legadas.
A DEA-C01 é muito nova para ter dados significativos de sinalização salarial por si só. Anedoticamente, os detentores estão relatando aumentos modestos no pipeline de entrevistas (mais recrutadores entrando em contato, conversão mais rápida de triagem para entrevista presencial), mas nenhuma diferença de remuneração consistente em relação a engenheiros de dados não certificados com experiência semelhante. A certificação tem apenas quatorze meses a partir de abril de 2026; levará mais um ou dois anos para que apareça de forma clara nos dados de remuneração.
O valor de carreira da certificação é mais sobre clareza de função do que salário. Ela sinaliza que você constrói especificamente pipelines de dados, o que ajuda a ser filtrado para as vagas de emprego certas em vez de se candidatar amplamente com a SAA-C03 e ser direcionado para funções de arquiteto que você não deseja.
Tempo de estudo e preparação
Janela padrão para certificações associadas da AWS: 80–150 horas. A DEA-C01 especificamente tende a estar no limite superior porque a superfície de serviços é ampla e vários serviços (Glue, Lake Formation, EMR Serverless) são operacionalmente complexos o suficiente para que ler sobre eles não seja o bastante — você precisa usá-los.
Arco de preparação sugerido:
- Semanas 1–3: Plano de aprendizado de Engenheiro de Dados do AWS Skill Builder (boa cobertura gratuita), além de ler a documentação do AWS Glue, Athena e Redshift. Não pule a documentação. O exame faz perguntas específicas sobre parâmetros de job do Glue e chaves de distribuição do Redshift que estão documentadas, mas nem sempre são abordadas em preparações de terceiros.
- Semanas 4–6: prática. Construa um pipeline de ponta a ponta. Ingira dados de um stream Kinesis para o S3 via Firehose, rastreie-os com Glue, consulte-os com Athena, transforme-os com um job ETL do Glue, carregue-os no Redshift. Mesmo em pequena escala, fazer isso uma vez ensina mais do que ler sobre o assunto três vezes.
- Semanas 7–8: prática de cenários. Navegue pelo banco de questões da DEA-C01 no CertLabPro para prática de exame cronometrado. Busque duas pontuações de prática consecutivas de 80%+ antes de agendar.
Conclusão
A DEA-C01 é uma certificação de nicho que atende a um nicho real e crescente. Se você já é um engenheiro de dados ou quer se tornar um, faça-a. Se você ainda não tem certeza se quer se especializar em engenharia de dados, faça a SAA-C03 primeiro — ela é mais reconhecida, mais geral, e você pode retornar à DEA-C01 mais tarde se a especialização fizer sentido.
A certificação é muito nova para afirmações salariais confiantes, e qualquer um que lhe diga que ela adicionará US$ 20 mil à sua remuneração está adivinhando. A proposta honesta é: é uma credencial válida e abençoada pela AWS para uma função que está contratando fortemente até 2026. Isso é o suficiente.