AWS Certified Machine Learning Engineer Associate
275 perguntas de prática
Última revisão: April 2026
Notas pessoais e links de recursos para sua jornada de estudo
Filtrar por Certificação
O AWS Certified Machine Learning Engineer Associate (MLA-C01) foi lançado em agosto de 2024 como a contraparte focada no profissional da antiga Machine Learning Specialty. Ele valida a capacidade de construir, implantar, monitorar e manter cargas de trabalho de ML na AWS — com forte ênfase no Amazon SageMaker, ferramentas MLOps e ciclos de vida de modelos em produção. O exame é voltado para engenheiros de ML em início e meio de carreira, cientistas de dados migrando para engenharia e engenheiros DevOps expandindo para plataformas de ML. Espere perguntas baseadas em cenários sobre pipelines de recursos, registros de modelos, padrões de implantação, detecção de desvio e inferência com consciência de custos. O exame é conceitual e prático (sem laboratórios), mas assume que o candidato já implementou modelos em produção.
O maior domínio, com 28%. SageMaker Data Wrangler, Feature Store, Glue e padrões de data lake no S3. Espere perguntas sobre como lidar com dados desequilibrados, vazamento de dados (leakage), estratégias de codificação e engenharia de recursos em escala.
Treinamento de trabalhos no SageMaker, algoritmos integrados versus BYOC (bring-your-own-container), JumpStart, ajuste de hiperparâmetros e avaliação de modelos. Dificuldade comum: escolher entre SageMaker Autopilot, Canvas e treinamento personalizado.
Endpoints do SageMaker (em tempo real, assíncronos, sem servidor, transformações em lote), Pipelines, Model Registry e CI/CD com CodePipeline. Os candidatos geralmente perdem as diferenças sutis entre os modos de implantação e suas compensações de custo.
SageMaker Model Monitor, Clarify (viés e explicabilidade), detecção de desvio e padrões IAM/VPC para cargas de trabalho de ML. Avalia a fluência prática em MLOps mais do que a teoria.
Serviços que você encontrará no exame e por que cada um importa.
Plataforma completa de ML que cobre notebooks, jobs de treinamento, ajuste de hiperparâmetros, jobs de processamento, endpoints de inferência gerenciados e pipelines de MLOps.
Por que está no exame: O SageMaker é o serviço abrangente que atravessa os quatro domínios do MLA-C01 — espere questões sobre escolhas de infraestrutura de treinamento, opções de implantação de inferência e tradeoffs entre soluções gerenciadas e auto-hospedadas.
IDE baseada na web para ML — notebooks Jupyter, experiments, Pipelines, Model Registry, JumpStart e Canvas em um único workspace.
Por que está no exame: O Domínio 2 (Desenvolvimento de Modelos de ML) avalia o Studio como a superfície unificada para iterar em modelos, depurar treinamentos e promover artefatos.
Catálogo de modelos fundacionais e específicos pré-treinados com implantação em um clique, notebooks de transfer learning e fluxos de fine-tuning.
Por que está no exame: O JumpStart é a resposta canônica quando uma questão pergunta como partir de um modelo pré-construído em vez de treinar do zero — relevante no Domínio 2.
Ferramenta de detecção de viés e explicabilidade que produz atribuições de features SHAP além de métricas de viés pré-treinamento e pós-treinamento em modelos tabulares e fundacionais.
Por que está no exame: Questões dos Domínios 2 e 4 sobre IA responsável, explicabilidade de modelos e auditorias de fairness apontam o Clarify como a resposta nativa da AWS.
Verifica continuamente endpoints implantados para detectar drift de qualidade de dados, drift de qualidade do modelo, drift de viés e drift de atribuição de features em relação a uma baseline.
Por que está no exame: O Domínio 4 (Monitoramento, Manutenção e Segurança) avalia repetidamente como detectar e responder a drift em produção — o Model Monitor é o serviço nomeado.
Repositório gerenciado para features de ML com armazenamentos online (baixa latência) e offline (batch) sincronizados, correção point-in-time e reúso de features entre modelos.
Por que está no exame: O Domínio 1 (Preparação de Dados) avalia o Feature Store como a forma canônica de evitar skew entre treinamento e serving e de compartilhar features entre equipes.
Orquestrador nativo de MLOps para o SageMaker — encadeia pré-processamento, treinamento, avaliação, registro de modelo e implantação condicional como um DAG versionado.
Por que está no exame: O Domínio 3 (Implantação e Orquestração) enfatiza pipelines reproduzíveis de ponta a ponta; Pipelines é a escolha nativa da AWS em vez de orquestradores genéricos para stacks centradas em SageMaker.
Ferramenta visual de preparação de dados dentro do Studio para importar dados do S3, Athena, Redshift e Snowflake, e aplicar mais de 300 transformações nativas em um clique.
Por que está no exame: Questões do Domínio 1 sobre engenharia de features e análise exploratória de dados frequentemente nomeiam o Data Wrangler como a resposta low-code para preparação tabular.
Armazenamento de objetos que funciona como data lake para datasets de treinamento, artefatos de modelo, entradas/saídas de inferência e dados offline do SageMaker Feature Store.
Por que está no exame: Todo cenário de preparação de dados e implantação de modelo no MLA-C01 pressupõe o S3 como substrato de dados; classes de armazenamento, políticas de ciclo de vida e padrões de acesso aparecem nos Domínios 1 e 4.
Serviço serverless de ETL com runtime Spark gerenciado, Data Catalog, crawlers para descoberta de schema e Glue DataBrew para transformação low-code.
Por que está no exame: O Domínio 1 nomeia o Glue como a ferramenta padrão de ETL e Data Catalog para mover dados brutos até o formato esperado pelo treinamento no SageMaker.
Motor SQL interativo serverless sobre o S3 (e fontes federadas), usando o Glue Data Catalog para schema e cobrando por consulta executada.
Por que está no exame: O Athena é a resposta esperada quando uma questão pergunta como executar SQL ad-hoc sobre dados de treinamento no S3 sem provisionar um cluster — comum no Domínio 1.
Plataforma gerenciada de Hadoop/Spark para processamento de dados em larga escala, com suporte a Spark MLlib, Hive, Presto e integração EMR com o SageMaker Studio.
Por que está no exame: O EMR aparece em cenários do Domínio 1 que ultrapassam a escala do Glue ou que exigem pipelines Spark MLlib fora do SageMaker.
Serviço de streaming de dados em tempo real para ingerir clickstream, eventos de IoT e logs em escala, com replay dentro da janela de retenção.
Por que está no exame: Questões do Domínio 1 sobre ingestão de features em streaming (por exemplo, detecção de fraude, atualização de recomendações) apontam o Kinesis como a resposta nativa da AWS.
Computação serverless para inferência orientada a eventos, pré-processamento leve, gatilhos por eventos do S3 e amarração de chamadas ao SageMaker em fluxos de negócio.
Por que está no exame: Cenários de implantação do Domínio 3 distinguem os tradeoffs entre "hospedar em endpoint do SageMaker" e "encapsular em Lambda" — questões sobre custo, cold start e tamanho de payload são comuns.
Registro gerenciado de containers para as imagens Docker que jobs de treinamento, jobs de processamento e endpoints de inferência do SageMaker baixam em tempo de execução.
Por que está no exame: O Domínio 3 avalia fluxos BYOC (bring-your-own-container) para treinamento e inferência customizados — o ECR é o registro nomeado, integrado a IAM e armazenamento.
Orquestrador serverless de workflows com integrações nativas ao SageMaker para treinamento, batch transform, implantação de endpoint e composição de etapas via Lambda.
Por que está no exame: Distinguir Step Functions (orquestração multi-serviço) de SageMaker Pipelines (MLOps nativo do SageMaker) é um padrão recorrente de distratores no Domínio 3.
Controle de acesso para toda a conta: usuários, roles, policies, federação e permissões de menor privilégio para cada ação no SageMaker, S3 e pipelines.
Por que está no exame: O Domínio 4 (Segurança) avalia execution roles do IAM para treinamento/inferência, compartilhamento de modelos entre contas e policies baseadas em recurso no data lake.
Criação e controle gerenciado de chaves criptográficas usadas para criptografar dados de treinamento, artefatos de modelo, volumes EBS das instâncias de treinamento e payloads de endpoint.
Por que está no exame: Criptografia em repouso com chaves gerenciadas pelo cliente é a resposta canônica do Domínio 4 para proteger corpora sensíveis de treinamento e propriedade intelectual de modelos.
Métricas, logs e alarmes para invocações de endpoint do SageMaker, progresso de jobs de treinamento, métricas customizadas de modelo e durações das etapas de pipeline.
Por que está no exame: O Domínio 4 espera o uso do CloudWatch para alarmes de latência e erro de endpoints, troubleshooting de logs de treinamento e exposição dos achados do Model Monitor para as equipes de operações.
Log de auditoria para toda a conta de cada chamada de API — quem disparou um job de treinamento, quem atualizou um endpoint, quem baixou artefatos de modelo do S3.
Por que está no exame: Cenários de compliance no Domínio 4 citam o CloudTrail como o registro imutável necessário para responder "quem implantou esse modelo" e "quando os dados de treinamento foram acessados".
$120k–$165k–$230k USD anual
O intervalo cobre cargos de MLE de nível médio a sênior baseados nos EUA, onde a proficiência em AWS é exigida. MLEs sênior em FAANG / unicórnios frequentemente excedem US$ 300 mil em compensação total (TC). Mercados de nível de entrada e não costeiros tendem a ser mais baixos. A certificação por si só não aumenta o salário — ela complementa um portfólio de sistemas de ML implementados.
Fonte: Cargos de engenheiro de ML 2025–2026 do levels.fyi, U.S. BLS OEWS maio de 2024 (15-2051 cientistas de dados, 15-1252 desenvolvedores de software). Os valores são aproximados; a compensação real depende da função, região e experiência.
A demanda por engenheiros de ML que podem colocar modelos em produção — não apenas treiná-los em notebooks — acelerou de 2024 a 2026, à medida que as empresas operacionalizaram cargas de trabalho de GenAI e ML clássico. O MLA-C01 funciona como um sinal crível de que um candidato entende o SageMaker de ponta a ponta e pode navegar pelas compensações de MLOps. Recrutadores em empresas centradas na AWS (serviços financeiros, saúde, equipes de dados de varejo) o usam como filtro de triagem juntamente com experiência em Python e PyTorch/TensorFlow. Ele se combina naturalmente com o AI Practitioner (AIF-C01) e o Data Engineer Associate (DEA-C01) para um perfil de dados e ML mais amplo. Ele NÃO qualifica, por si só, candidatos para funções de pesquisa em ML, posições de especialista em deep learning ou títulos de arquiteto de plataforma de ML — essas funções esperam experiência de vários anos em sistemas implementados, além de, frequentemente, um diploma de pós-graduação.
Não há pré-requisitos formais. A AWS recomenda pelo menos um ano de experiência prática com SageMaker e fluxos de trabalho de ML, além de conhecimento prático de Python, bibliotecas comuns de ML (scikit-learn, pandas, PyTorch ou TensorFlow) e estatística básica.
O caminho mais eficiente é passar no AIF-C01 primeiro (vocabulário fundamental de IA), depois construir um pequeno projeto SageMaker de ponta a ponta — feature store, trabalho de treinamento, registro de modelo, endpoint em tempo real, monitor — antes de fazer o MLA-C01. Candidatos com formação em Cloud Practitioner (CLF-C02) ou Solutions Architect Associate (SAA-C03) acham as perguntas sobre serviços da AWS muito mais fáceis. Uma formação puramente em ciência de dados sem exposição à AWS é o ponto de partida mais difícil e geralmente exige mais de 80 horas de estudo adicional específico do serviço.
O MLA-C01 é classificado como Associado e é significativamente mais difícil que o AIF-C01 porque pressupõe fluência prática no SageMaker. Planeje 80–120 horas ao longo de 8–12 semanas se você tiver experiência prévia em ML, mas exposição limitada à AWS; 40–60 horas ao longo de 4–6 semanas se você já trabalha diariamente em pipelines de ML da AWS. O exame tem 65 questões pontuadas em 170 minutos — múltipla escolha e múltipla resposta, sem laboratórios.
O obstáculo mais comum é a amplitude dos subsídios do SageMaker (Studio, Pipelines, Feature Store, Model Registry, Clarify, Model Monitor, JumpStart, Canvas, Autopilot, Ground Truth) — as perguntas muitas vezes dependem de escolher a ferramenta certa para um cenário restrito. O segundo problema são os modos de implantação: saber precisamente quando usar endpoints em tempo real versus assíncronos versus sem servidor versus transformação em lote, e as compensações de custo e latência de cada um.
Disponibilidade geral inicial. O exame beta foi realizado em meados de 2024. Substitui o antigo Machine Learning Specialty (MLS-C01) para candidatos focados em engenharia. Versão atual a partir de abril de 2026.
MLA-C01 (AWS Certified Machine Learning Engineer Associate) é um exame de nível Associate um exame de dificuldade moderada que exige experiência prática e um sólido entendimento das melhores práticas. A maioria dos candidatos precisa de 80 a 150 horas de estudo distribuídas em 6 a 12 semanas para exames de nível associado. A maioria dos candidatos que pontuam consistentemente acima do limite de aprovação em exames práticos é aprovada na primeira tentativa.
A maioria dos candidatos precisa de 80 a 150 horas de estudo distribuídas em 6 a 12 semanas para exames de nível associado. O tempo para aprovação varia amplamente de acordo com a experiência prévia. Engenheiros com experiência prática de produção na tecnologia subjacente geralmente precisam de menos tempo; candidatos novos na plataforma devem planejar-se para o limite superior dessa faixa.
MLA-C01 é uma credencial reconhecida no ecossistema AWS e sinaliza conhecimento validado para empregadores, recrutadores e clientes. Se vale a pena o tempo e a taxa para você, depende do seu papel e objetivos — geralmente compensa mais para engenheiros de nuvem, arquitetos e consultores que trabalham com AWS diariamente ou desejam mudar para funções que o fazem.
A pontuação de aprovação para MLA-C01 é 720 / 1000. O exame contém 65 questões e dura 2 h 50 min.
A taxa do exame MLA-C01 é $150 USD. As taxas são definidas por AWS e podem variar por região; sempre confirme o preço atual na página oficial de certificação AWS antes de agendar.
As certificações AWS são válidas por 3 anos. Recertifique-se passando na versão atual do mesmo exame, ou passando em um exame de nível superior no mesmo caminho antes do vencimento.
Sim. Você pode fazer o exame online (supervisionado através do navegador seguro do provedor, disponível 24 horas por dia, 7 dias por semana na maioria das regiões) ou em um centro de testes Pearson VUE presencial durante o horário comercial. Ambos os formatos usam as mesmas perguntas, limite de tempo e pontuação de aprovação.
A CertLabPro oferece 15 modos de estudo no banco de questões práticas para MLA-C01. O modo de simulação de exame espelha o exame real: 65 questões em 2 h 50 min, com o mesmo limite de aprovação de 720 / 1000. O modo de navegação permite que você leia todas as perguntas e respostas estaticamente.