Une entreprise de vente au détail construit un moteur de recommandation et stocke des données brutes de flux de clics dans Amazon S3. Le scientifique des données doit explorer, nettoyer et transformer ces données avant l'entraînement. L'équipe souhaite une interface visuelle, à faible code, pour la préparation des données qui s'intègre directement à Amazon SageMaker. Quel service AWS l'équipe doit-elle utiliser ?

La certification AWS Certified Machine Learning Engineer Associate (MLA-C01) a été lancée en août 2024 en tant qu'équivalent axé sur la pratique de l'ancienne certification Machine Learning Specialty. Elle valide la capacité à construire, déployer, surveiller et maintenir des charges de travail ML sur AWS — avec un fort accent sur Amazon SageMaker, les outils MLOps et les cycles de vie des modèles en production. L'examen s'adresse aux ingénieurs ML en début et milieu de carrière, aux scientifiques de données s'orientant vers l'ingénierie et aux ingénieurs DevOps s'étendant aux plateformes ML. Attendez-vous à des questions basées sur des scénarios concernant les pipelines de fonctionnalités, les registres de modèles, les modèles de déploiement, la détection de dérive et l'inférence soucieuse des coûts. L'examen est conceptuel et sans pratique (pas de laboratoires), mais suppose que le candidat a réellement mis des modèles en production.

Domaines de l'examen

Data Preparation for ML28%
Le domaine le plus important, représentant 28%. SageMaker Data Wrangler, Feature Store, Glue et les modèles de lac de données S3. Attendez-vous à des questions sur la gestion des données déséquilibrées, des fuites, des stratégies d'encodage et de l'ingénierie des fonctionnalités à grande échelle.
ML Model Development26%
Tâches d'entraînement SageMaker, algorithmes intégrés vs. apport de votre propre conteneur, JumpStart, optimisation des hyperparamètres et évaluation de modèles. Piège courant : choisir entre SageMaker Autopilot, Canvas et l'entraînement personnalisé.
Deployment and Orchestration of ML Workflows22%
Points de terminaison SageMaker (temps réel, asynchrone, sans serveur, transformation par lots), Pipelines, Model Registry et CI/CD avec CodePipeline. Les candidats manquent souvent les différences subtiles entre les modes de déploiement et leurs compromis en termes de coûts.
ML Solution Monitoring, Maintenance, and Security24%
SageMaker Model Monitor, Clarify (biais et explicabilité), détection de dérive et modèles IAM/VPC pour les charges de travail ML. Teste davantage la maîtrise pratique des MLOps que la théorie.

Services AWS dans cet examen

Les services que vous rencontrerez à l'examen et pourquoi chacun compte.

Services principaux

Amazon SageMakerDocumentation AWS ↗
Plateforme ML de bout en bout couvrant les notebooks, les jobs d'entraînement, l'optimisation des hyperparamètres, les jobs de traitement, les points de terminaison d'inférence managés et les pipelines MLOps.
Pourquoi il est à l'examen : SageMaker est le service englobant les quatre domaines du MLA-C01 — attendez-vous à des questions sur les choix d'infrastructure d'entraînement, les options de déploiement d'inférence et les compromis entre managé et auto-hébergé.
Amazon SageMaker StudioDocumentation AWS ↗
IDE web pour le ML — notebooks Jupyter, expériences, Pipelines, Model Registry, JumpStart et Canvas réunis dans un seul espace de travail.
Pourquoi il est à l'examen : Le Domaine 2 (Développement de modèles ML) évalue Studio comme la surface unifiée pour itérer sur les modèles, déboguer l'entraînement et promouvoir les artefacts.
Amazon SageMaker JumpStartDocumentation AWS ↗
Catalogue de modèles de fondation et de modèles spécifiques à une tâche pré-entraînés, avec déploiement en un clic, notebooks d'apprentissage par transfert et flux de fine-tuning.
Pourquoi il est à l'examen : JumpStart est la réponse canonique lorsqu'une question demande comment partir d'un modèle préconstruit plutôt que d'entraîner depuis zéro — pertinent dans le Domaine 2.
Amazon SageMaker ClarifyDocumentation AWS ↗
Outil de détection de biais et d'explicabilité qui produit des attributions de features SHAP ainsi que des métriques de biais avant et après entraînement sur des modèles tabulaires et de fondation.
Pourquoi il est à l'examen : Les questions des Domaines 2 et 4 sur l'IA responsable, l'explicabilité des modèles et les audits d'équité désignent Clarify comme la réponse AWS native.
Amazon SageMaker Model MonitorDocumentation AWS ↗
Vérifie en continu les points de terminaison déployés pour détecter la dérive de qualité des données, la dérive de qualité du modèle, la dérive de biais et la dérive d'attribution de features par rapport à une référence.
Pourquoi il est à l'examen : Le Domaine 4 (Surveillance, maintenance et sécurité) évalue régulièrement comment détecter et répondre à la dérive en production — Model Monitor est le service nommé.
Amazon SageMaker Feature StoreDocumentation AWS ↗
Dépôt managé pour les features ML avec stockages en ligne (faible latence) et hors ligne (par lots) synchronisés, exactitude point-in-time et réutilisation des features entre modèles.
Pourquoi il est à l'examen : Le Domaine 1 (Préparation des données) évalue Feature Store comme le moyen canonique d'éviter le décalage entraînement/service et de partager les features entre équipes.
Amazon SageMaker PipelinesDocumentation AWS ↗
Orchestrateur MLOps natif pour SageMaker — enchaîne le prétraitement, l'entraînement, l'évaluation, l'enregistrement du modèle et le déploiement conditionnel sous forme de DAG versionné.
Pourquoi il est à l'examen : Le Domaine 3 (Déploiement et orchestration) insiste sur les pipelines de bout en bout reproductibles ; Pipelines est le choix AWS natif face aux orchestrateurs génériques pour les stacks centrées sur SageMaker.
Amazon SageMaker Data WranglerDocumentation AWS ↗
Outil visuel de préparation de données dans Studio pour importer depuis S3, Athena, Redshift, Snowflake et appliquer plus de 300 transformations intégrées en un clic.
Pourquoi il est à l'examen : Les questions du Domaine 1 sur le feature engineering et l'analyse exploratoire de données désignent fréquemment Data Wrangler comme la réponse low-code pour la préparation tabulaire.

Services spécialisés

Amazon S3Documentation AWS ↗
Stockage d'objets servant de data lake pour les jeux de données d'entraînement, les artefacts de modèle, les entrées/sorties d'inférence et les données hors ligne de SageMaker Feature Store.
Pourquoi il est à l'examen : Chaque scénario MLA-C01 de préparation de données et de déploiement de modèle suppose S3 comme substrat de données ; les classes de stockage, les politiques de cycle de vie et les schémas d'accès apparaissent dans les Domaines 1 et 4.
AWS GlueDocumentation AWS ↗
Service ETL serverless avec un runtime Spark managé, un Data Catalog, des crawlers pour la découverte de schémas et Glue DataBrew pour la transformation low-code.
Pourquoi il est à l'examen : Le Domaine 1 désigne Glue comme l'outil ETL/catalogue de données par défaut pour amener les données brutes dans la forme attendue par l'entraînement SageMaker.
Amazon AthenaDocumentation AWS ↗
Moteur SQL interactif serverless sur S3 (et sources fédérées), utilisant le Data Catalog de Glue pour le schéma et une tarification au paiement par requête.
Pourquoi il est à l'examen : Athena est la réponse attendue lorsqu'une question demande comment exécuter du SQL ad hoc sur des données d'entraînement S3 sans démarrer de cluster — courant dans le Domaine 1.
Amazon EMRDocumentation AWS ↗
Plateforme Hadoop/Spark managée pour le traitement de données à grande échelle, prenant en charge Spark MLlib, Hive, Presto et l'intégration EMR de SageMaker Studio.
Pourquoi il est à l'examen : EMR apparaît dans les scénarios du Domaine 1 qui dépassent l'échelle de Glue ou qui nécessitent des pipelines Spark MLlib en dehors de SageMaker.
Amazon Kinesis Data StreamsDocumentation AWS ↗
Service de streaming de données en temps réel pour ingérer à grande échelle les clickstreams, événements IoT et logs, rejouables pendant la durée de rétention.
Pourquoi il est à l'examen : Les questions du Domaine 1 sur l'ingestion de features en streaming (détection de fraude, fraîcheur des recommandations) désignent Kinesis comme la réponse AWS native.
AWS LambdaDocumentation AWS ↗
Compute serverless pour l'inférence pilotée par événement, le prétraitement léger, les déclencheurs d'événements S3 et l'enchaînement d'appels SageMaker dans des workflows métier.
Pourquoi il est à l'examen : Les scénarios de déploiement du Domaine 3 distinguent les compromis « hébergement sur point de terminaison SageMaker » vs « emballage dans Lambda » — les questions de coût, de démarrage à froid et de taille de payload sont courantes.
Amazon ECRDocumentation AWS ↗
Registre de conteneurs managé pour les images Docker que les jobs d'entraînement SageMaker, les jobs de traitement et les points de terminaison d'inférence récupèrent à l'exécution.
Pourquoi il est à l'examen : Le Domaine 3 évalue les flux BYOC (bring-your-own-container) pour l'entraînement/inférence personnalisé — ECR est le registre de stockage nommé, intégré à IAM.
AWS Step FunctionsDocumentation AWS ↗
Orchestrateur de workflows serverless avec intégrations SageMaker natives pour l'entraînement, la transformation par lots, le déploiement de points de terminaison et la composition d'étapes Lambda.
Pourquoi il est à l'examen : Distinguer Step Functions (orchestration multi-services) de SageMaker Pipelines (MLOps natif SageMaker) est un schéma de distracteur récurrent dans le Domaine 3.

Sécurité et gouvernance

AWS Identity and Access Management (IAM)Documentation AWS ↗
Contrôle d'accès à l'échelle du compte : utilisateurs, rôles, politiques, fédération et permissions de moindre privilège pour chaque action SageMaker, S3 et de pipeline.
Pourquoi il est à l'examen : Le Domaine 4 (Sécurité) évalue les rôles d'exécution IAM pour l'entraînement/inférence, le partage de modèles entre comptes et les politiques basées sur les ressources sur le data lake.
AWS Key Management Service (KMS)Documentation AWS ↗
Création et contrôle managés des clés cryptographiques utilisées pour chiffrer les données d'entraînement, les artefacts de modèle, les volumes EBS des instances d'entraînement et les payloads des points de terminaison.
Pourquoi il est à l'examen : Le chiffrement au repos avec des clés gérées par le client est la réponse canonique du Domaine 4 pour protéger les corpus d'entraînement sensibles et la propriété intellectuelle des modèles.
Amazon CloudWatchDocumentation AWS ↗
Métriques, logs et alarmes pour les invocations de points de terminaison SageMaker, la progression des jobs d'entraînement, les métriques de modèle personnalisées et les durées d'étapes de pipeline.
Pourquoi il est à l'examen : Le Domaine 4 attend CloudWatch pour les alarmes de latence/erreur des points de terminaison, le dépannage des logs de jobs d'entraînement et la remontée des résultats de Model Monitor vers les équipes ops.
AWS CloudTrailDocumentation AWS ↗
Journal d'audit à l'échelle du compte de chaque appel d'API — qui a lancé un job d'entraînement, qui a mis à jour un point de terminaison, qui a téléchargé des artefacts de modèle depuis S3.
Pourquoi il est à l'examen : Les scénarios de conformité du Domaine 4 citent CloudTrail comme la trace immuable nécessaire pour répondre à « qui a déployé ce modèle » et « quand les données d'entraînement ont-elles été consultées ».

Impact sur la carrière

Rôles typiques

Ingénieur en Machine Learning
Ingénieur MLOps
Ingénieur de plateforme IA/ML
Scientifique de données (orienté ingénierie)
Architecte de solutions ML AWS
Ingénieur en applications IA
Consultant ML Cloud

Fourchette de salaires (É.-U., approximatif)

$120k–$165k–$230k USD annuel

La fourchette couvre les rôles d'ingénieurs ML de niveau intermédiaire à senior basés aux États-Unis où la maîtrise d'AWS est requise. Les ingénieurs ML seniors des FAANG / licornes dépassent fréquemment les 300 000 $ en rémunération totale. Les marchés d'entrée de gamme et hors zones côtières tendent à être plus bas. La certification seule n'augmente pas le salaire — elle complète un portefeuille de systèmes ML mis en production.

Source : rôles d'ingénieurs ML 2025–2026 selon levels.fyi, U.S. BLS OEWS mai 2024 (15-2051 data scientists, 15-1252 software developers). Les chiffres sont approximatifs ; la rémunération réelle dépend du rôle, de la région et de l'expérience.

Demande du marché

La demande pour les ingénieurs ML capables de mettre des modèles en production — et pas seulement de les entraîner dans des notebooks — s'est accélérée de 2024 à 2026 à mesure que les entreprises ont opérationnalisé la GenAI et les charges de travail ML classiques. Le MLA-C01 fonctionne comme un signal crédible qu'un candidat comprend SageMaker de bout en bout et peut gérer les compromis MLOps. Les recruteurs dans les entreprises axées sur AWS (services financiers, santé, équipes de données de vente au détail) l'utilisent comme filtre de sélection aux côtés de l'expérience Python et PyTorch/TensorFlow. Il s'associe naturellement avec l'AI Practitioner (AIF-C01) et le Data Engineer Associate (DEA-C01) pour un profil de données et ML plus large. Il ne qualifie PAS à lui seul les candidats pour des rôles de recherche en ML, des postes de spécialiste en apprentissage profond ou des titres d'architecte de plateforme ML — ces postes exigent une expérience de plusieurs années avec des systèmes mis en production, souvent complétée par un diplôme universitaire supérieur.

Prérequis et parcours recommandé

Il n'y a pas de prérequis formels. AWS recommande au moins un an d'expérience pratique avec SageMaker et les flux de travail ML, ainsi qu'une connaissance pratique de Python, des bibliothèques ML courantes (scikit-learn, pandas, PyTorch ou TensorFlow) et des statistiques de base.

Le chemin le plus efficace est de passer d'abord l'AIF-C01 (vocabulaire fondamental de l'IA), puis de construire un petit projet SageMaker de bout en bout — feature store, tâche d'entraînement, registre de modèles, point de terminaison en temps réel, monitoring — avant de passer le MLA-C01. Les candidats ayant une expérience Cloud Practitioner (CLF-C02) ou Solutions Architect Associate (SAA-C03) trouvent les questions sur les services AWS beaucoup plus faciles. Un pur profil de data scientist sans exposition à AWS est le point de départ le plus difficile et nécessite généralement plus de 80 heures d'étude supplémentaire spécifique aux services.

Difficulté et temps d'étude

Le MLA-C01 est classé Associé et est significativement plus difficile que l'AIF-C01 car il suppose une maîtrise pratique de SageMaker. Prévoyez 80 à 120 heures sur 8 à 12 semaines si vous avez une expérience ML préalable mais une exposition limitée à AWS ; 40 à 60 heures sur 4 à 6 semaines si vous travaillez déjà quotidiennement sur des pipelines ML AWS. L'examen comprend 65 questions notées en 170 minutes — questions à choix multiples et à réponses multiples, pas de laboratoires.

Le piège le plus courant est l'étendue des sous-services SageMaker (Studio, Pipelines, Feature Store, Model Registry, Clarify, Model Monitor, JumpStart, Canvas, Autopilot, Ground Truth) — les questions reposent souvent sur le choix du bon outil pour un scénario contraint. Le second piège concerne les modes de déploiement : savoir précisément quand utiliser les points de terminaison temps réel, asynchrone, sans serveur ou de transformation par lots, ainsi que les compromis de coût et de latence de chacun.

Historique des versions de l'examen

MLA-C012024-08
Disponibilité générale initiale. L'examen bêta a eu lieu mi-2024. Remplace l'ancienne certification Machine Learning Specialty (MLS-C01) pour les candidats axés sur l'ingénierie. Version actuelle à partir d'avril 2026.

Questions fréquemment posées

Quelle est la difficulté de l'examen MLA-C01 ?

MLA-C01 (AWS Certified Machine Learning Engineer Associate) est un examen de niveau Associate un examen de difficulté modérée exigeant une expérience pratique concrète ainsi qu'une solide compréhension des meilleures pratiques. La plupart des candidats ont besoin de 80 à 150 heures d'étude réparties sur 6 à 12 semaines pour les examens de niveau associé. La plupart des candidats qui obtiennent des scores constamment supérieurs au seuil de réussite lors des examens pratiques réussissent dès leur première tentative.

Combien de temps faut-il étudier pour le MLA-C01 ?

La plupart des candidats ont besoin de 80 à 150 heures d'étude réparties sur 6 à 12 semaines pour les examens de niveau associé. Le temps nécessaire pour réussir varie considérablement en fonction de l'expérience antérieure. Les ingénieurs ayant une expérience pratique en production avec la technologie sous-jacente en ont généralement besoin de moins ; les candidats novices sur la plateforme devraient viser la limite supérieure de cette fourchette.

La certification MLA-C01 en vaut-elle la peine ?

MLA-C01 est une certification reconnue dans l'écosystème AWS et signale des connaissances validées aux employeurs, recruteurs et clients. Sa valeur en termes de temps et de coût dépend de votre rôle et de vos objectifs — elle est la plus avantageuse pour les ingénieurs cloud, architectes et consultants qui travaillent quotidiennement avec AWS ou souhaitent évoluer vers des rôles similaires.

Quel est le score de réussite pour l'examen MLA-C01 ?

Le score de réussite pour le MLA-C01 est de 720 / 1000. L'examen contient 65 questions et dure 2 h 50 min.

Combien coûte l'examen MLA-C01 ?

Les frais d'examen MLA-C01 sont de $150 USD. Les frais sont fixés par AWS et peuvent varier selon la région ; confirmez toujours le prix actuel sur la page de certification officielle de AWS avant de réserver.

Combien de temps la certification MLA-C01 est-elle valide ?

Les certifications AWS sont valides pendant 3 ans. Recertifiez-vous en réussissant la version actuelle du même examen, ou en réussissant un examen de niveau supérieur dans le même parcours avant l'expiration.

Puis-je passer le MLA-C01 en ligne ?

Oui. Vous pouvez passer l'examen en ligne (supervisé via le navigateur sécurisé du fournisseur, disponible 24h/24 et 7j/7 dans la plupart des régions) ou dans un centre de test Pearson VUE en personne pendant les heures ouvrables. Les deux formats utilisent les mêmes questions, la même limite de temps et le même score de réussite.

Combien de questions contient l'examen pratique MLA-C01 sur CertLabPro ?

CertLabPro propose 15 modes d'étude à travers la banque de questions pratiques pour le MLA-C01. Le mode de simulation d'examen reproduit l'examen réel : 65 questions en 2 h 50 min, avec le même seuil de réussite de 720 / 1000. Le mode navigation vous permet de lire chaque Q&A de manière statique.

Guides d'étude associés

Certifications connexes

AI-103

Microsoft Azure AI Apps and Agents Developer Associate

Associate

PMLE

Google Cloud Professional Machine Learning Engineer

Professional

DP-100

Microsoft Azure Data Scientist Associate

Associate

SAA-C03

AWS Certified Solutions Architect Associate

Associate

AWS

MLA-C01

AWS Certified Machine Learning Engineer Associate

275 questions de pratique

Dernière révision : April 2026

Domaines de l'Examen

Data Preparation for ML28%

ML Model Development26%

Deployment and Orchestration of ML Workflows22%

ML Solution Monitoring, Maintenance, and Security24%

ℹ️

Infos examen

Inscription, frais, déroulement et règles

→

📝

Mode Examen

65 questions aléatoires
Compte à rebours de 170 minutes
Score à la fin (réussite: 720/1000)
Simule l'examen réel

📘

Guide

Modèles scénario → solution
Groupé par domaine d'examen
Complet et gratuit sur le web et le mobile
Pure référence — sans questions, sans score

📚

Mode Pratique

Toutes les 275 questions
Pas de limite de temps
Feedback instantané après chaque réponse
Apprenez à votre rythme

📑

Mode Navigation

Toutes les 275 questions sur une page
Réponses et explications visibles
Révision rapide avant l'examen
Faites défiler tout

🌿

Mode Zen

Une question à la fois
Glissez ou utilisez les flèches
Option de mélange disponible
Étude détendue style flashcard

⚡

Time Attack

Commencez avec 60 secondes
+10s pour bonne réponse
-5s pour mauvaise réponse
Battez votre record

❤️

Survie

Temps illimité
Fin de partie à la première erreur
Construisez votre série
Testez votre cohérence

⚩

Mode Blitz

15 secondes par question
Bonus pour réponses rapides
Multiplicateur de série (2x, 3x...)
Test de vitesse style arcade

🏃

Mode Sprint

Chronomètre ascendant
Obtenez 10/25/50 bonnes réponses d'affilée
Mauvaise réponse réinitialise votre série
Battez votre meilleur temps personnel

🎓

Mode Flashcard

Question seule, sans options
Touchez pour révéler la réponse
Évaluez : Je savais / Partiellement / Je ne savais pas
Les questions faibles réapparaissent plus tôt

📚

Mode Bachotage

Priorise les questions non vues en premier
Puis les questions que vous avez ratées
Feedback instantané après chaque réponse
Suivez votre couverture totale

🔥

Défi de Série

Pas de pression de temps
Suivez votre plus longue série
Mauvaise réponse remet à zéro
Battez votre record personnel

💪

Maillon Faible

Uniquement les questions que vous avez ratées
Répondez correctement 3 fois pour maîtriser
Suivez le progrès de maîtrise
Éliminez vos points faibles

📅

Révision SRS

Révision quotidienne par répétition espacée
Questions planifiées à intervalles optimaux
Évaluez : Encore / Difficile / Bien / Facile
Construisez votre série de révision quotidienne

🛠️

Atelier pratique

Terraform simple / OpenTofu
Chaque bloc expliqué
Copier-coller dans votre terminal
Lié aux domaines de l'examen

📝

Notes d'Étude

Notes personnelles et liens de ressources pour votre parcours d'étude

📅

Calendrier d'Activité

Filtrer par Certification

Aperçu

Domaines de l'examen

Data Preparation for ML28%
Le domaine le plus important, représentant 28%. SageMaker Data Wrangler, Feature Store, Glue et les modèles de lac de données S3. Attendez-vous à des questions sur la gestion des données déséquilibrées, des fuites, des stratégies d'encodage et de l'ingénierie des fonctionnalités à grande échelle.
ML Model Development26%
Tâches d'entraînement SageMaker, algorithmes intégrés vs. apport de votre propre conteneur, JumpStart, optimisation des hyperparamètres et évaluation de modèles. Piège courant : choisir entre SageMaker Autopilot, Canvas et l'entraînement personnalisé.
Deployment and Orchestration of ML Workflows22%
Points de terminaison SageMaker (temps réel, asynchrone, sans serveur, transformation par lots), Pipelines, Model Registry et CI/CD avec CodePipeline. Les candidats manquent souvent les différences subtiles entre les modes de déploiement et leurs compromis en termes de coûts.
ML Solution Monitoring, Maintenance, and Security24%
SageMaker Model Monitor, Clarify (biais et explicabilité), détection de dérive et modèles IAM/VPC pour les charges de travail ML. Teste davantage la maîtrise pratique des MLOps que la théorie.

Services AWS dans cet examen

Les services que vous rencontrerez à l'examen et pourquoi chacun compte.

Services principaux

Amazon SageMakerDocumentation AWS ↗
Plateforme ML de bout en bout couvrant les notebooks, les jobs d'entraînement, l'optimisation des hyperparamètres, les jobs de traitement, les points de terminaison d'inférence managés et les pipelines MLOps.
Pourquoi il est à l'examen : SageMaker est le service englobant les quatre domaines du MLA-C01 — attendez-vous à des questions sur les choix d'infrastructure d'entraînement, les options de déploiement d'inférence et les compromis entre managé et auto-hébergé.
Amazon SageMaker StudioDocumentation AWS ↗
IDE web pour le ML — notebooks Jupyter, expériences, Pipelines, Model Registry, JumpStart et Canvas réunis dans un seul espace de travail.
Pourquoi il est à l'examen : Le Domaine 2 (Développement de modèles ML) évalue Studio comme la surface unifiée pour itérer sur les modèles, déboguer l'entraînement et promouvoir les artefacts.
Amazon SageMaker JumpStartDocumentation AWS ↗
Catalogue de modèles de fondation et de modèles spécifiques à une tâche pré-entraînés, avec déploiement en un clic, notebooks d'apprentissage par transfert et flux de fine-tuning.
Pourquoi il est à l'examen : JumpStart est la réponse canonique lorsqu'une question demande comment partir d'un modèle préconstruit plutôt que d'entraîner depuis zéro — pertinent dans le Domaine 2.
Amazon SageMaker ClarifyDocumentation AWS ↗
Outil de détection de biais et d'explicabilité qui produit des attributions de features SHAP ainsi que des métriques de biais avant et après entraînement sur des modèles tabulaires et de fondation.
Pourquoi il est à l'examen : Les questions des Domaines 2 et 4 sur l'IA responsable, l'explicabilité des modèles et les audits d'équité désignent Clarify comme la réponse AWS native.
Amazon SageMaker Model MonitorDocumentation AWS ↗
Vérifie en continu les points de terminaison déployés pour détecter la dérive de qualité des données, la dérive de qualité du modèle, la dérive de biais et la dérive d'attribution de features par rapport à une référence.
Pourquoi il est à l'examen : Le Domaine 4 (Surveillance, maintenance et sécurité) évalue régulièrement comment détecter et répondre à la dérive en production — Model Monitor est le service nommé.
Amazon SageMaker Feature StoreDocumentation AWS ↗
Dépôt managé pour les features ML avec stockages en ligne (faible latence) et hors ligne (par lots) synchronisés, exactitude point-in-time et réutilisation des features entre modèles.
Pourquoi il est à l'examen : Le Domaine 1 (Préparation des données) évalue Feature Store comme le moyen canonique d'éviter le décalage entraînement/service et de partager les features entre équipes.
Amazon SageMaker PipelinesDocumentation AWS ↗
Orchestrateur MLOps natif pour SageMaker — enchaîne le prétraitement, l'entraînement, l'évaluation, l'enregistrement du modèle et le déploiement conditionnel sous forme de DAG versionné.
Pourquoi il est à l'examen : Le Domaine 3 (Déploiement et orchestration) insiste sur les pipelines de bout en bout reproductibles ; Pipelines est le choix AWS natif face aux orchestrateurs génériques pour les stacks centrées sur SageMaker.
Amazon SageMaker Data WranglerDocumentation AWS ↗
Outil visuel de préparation de données dans Studio pour importer depuis S3, Athena, Redshift, Snowflake et appliquer plus de 300 transformations intégrées en un clic.
Pourquoi il est à l'examen : Les questions du Domaine 1 sur le feature engineering et l'analyse exploratoire de données désignent fréquemment Data Wrangler comme la réponse low-code pour la préparation tabulaire.

Services spécialisés

Amazon S3Documentation AWS ↗
Stockage d'objets servant de data lake pour les jeux de données d'entraînement, les artefacts de modèle, les entrées/sorties d'inférence et les données hors ligne de SageMaker Feature Store.
Pourquoi il est à l'examen : Chaque scénario MLA-C01 de préparation de données et de déploiement de modèle suppose S3 comme substrat de données ; les classes de stockage, les politiques de cycle de vie et les schémas d'accès apparaissent dans les Domaines 1 et 4.
AWS GlueDocumentation AWS ↗
Service ETL serverless avec un runtime Spark managé, un Data Catalog, des crawlers pour la découverte de schémas et Glue DataBrew pour la transformation low-code.
Pourquoi il est à l'examen : Le Domaine 1 désigne Glue comme l'outil ETL/catalogue de données par défaut pour amener les données brutes dans la forme attendue par l'entraînement SageMaker.
Amazon AthenaDocumentation AWS ↗
Moteur SQL interactif serverless sur S3 (et sources fédérées), utilisant le Data Catalog de Glue pour le schéma et une tarification au paiement par requête.
Pourquoi il est à l'examen : Athena est la réponse attendue lorsqu'une question demande comment exécuter du SQL ad hoc sur des données d'entraînement S3 sans démarrer de cluster — courant dans le Domaine 1.
Amazon EMRDocumentation AWS ↗
Plateforme Hadoop/Spark managée pour le traitement de données à grande échelle, prenant en charge Spark MLlib, Hive, Presto et l'intégration EMR de SageMaker Studio.
Pourquoi il est à l'examen : EMR apparaît dans les scénarios du Domaine 1 qui dépassent l'échelle de Glue ou qui nécessitent des pipelines Spark MLlib en dehors de SageMaker.
Amazon Kinesis Data StreamsDocumentation AWS ↗
Service de streaming de données en temps réel pour ingérer à grande échelle les clickstreams, événements IoT et logs, rejouables pendant la durée de rétention.
Pourquoi il est à l'examen : Les questions du Domaine 1 sur l'ingestion de features en streaming (détection de fraude, fraîcheur des recommandations) désignent Kinesis comme la réponse AWS native.
AWS LambdaDocumentation AWS ↗
Compute serverless pour l'inférence pilotée par événement, le prétraitement léger, les déclencheurs d'événements S3 et l'enchaînement d'appels SageMaker dans des workflows métier.
Pourquoi il est à l'examen : Les scénarios de déploiement du Domaine 3 distinguent les compromis « hébergement sur point de terminaison SageMaker » vs « emballage dans Lambda » — les questions de coût, de démarrage à froid et de taille de payload sont courantes.
Amazon ECRDocumentation AWS ↗
Registre de conteneurs managé pour les images Docker que les jobs d'entraînement SageMaker, les jobs de traitement et les points de terminaison d'inférence récupèrent à l'exécution.
Pourquoi il est à l'examen : Le Domaine 3 évalue les flux BYOC (bring-your-own-container) pour l'entraînement/inférence personnalisé — ECR est le registre de stockage nommé, intégré à IAM.
AWS Step FunctionsDocumentation AWS ↗
Orchestrateur de workflows serverless avec intégrations SageMaker natives pour l'entraînement, la transformation par lots, le déploiement de points de terminaison et la composition d'étapes Lambda.
Pourquoi il est à l'examen : Distinguer Step Functions (orchestration multi-services) de SageMaker Pipelines (MLOps natif SageMaker) est un schéma de distracteur récurrent dans le Domaine 3.

Sécurité et gouvernance

AWS Identity and Access Management (IAM)Documentation AWS ↗
Contrôle d'accès à l'échelle du compte : utilisateurs, rôles, politiques, fédération et permissions de moindre privilège pour chaque action SageMaker, S3 et de pipeline.
Pourquoi il est à l'examen : Le Domaine 4 (Sécurité) évalue les rôles d'exécution IAM pour l'entraînement/inférence, le partage de modèles entre comptes et les politiques basées sur les ressources sur le data lake.
AWS Key Management Service (KMS)Documentation AWS ↗
Création et contrôle managés des clés cryptographiques utilisées pour chiffrer les données d'entraînement, les artefacts de modèle, les volumes EBS des instances d'entraînement et les payloads des points de terminaison.
Pourquoi il est à l'examen : Le chiffrement au repos avec des clés gérées par le client est la réponse canonique du Domaine 4 pour protéger les corpus d'entraînement sensibles et la propriété intellectuelle des modèles.
Amazon CloudWatchDocumentation AWS ↗
Métriques, logs et alarmes pour les invocations de points de terminaison SageMaker, la progression des jobs d'entraînement, les métriques de modèle personnalisées et les durées d'étapes de pipeline.
Pourquoi il est à l'examen : Le Domaine 4 attend CloudWatch pour les alarmes de latence/erreur des points de terminaison, le dépannage des logs de jobs d'entraînement et la remontée des résultats de Model Monitor vers les équipes ops.
AWS CloudTrailDocumentation AWS ↗
Journal d'audit à l'échelle du compte de chaque appel d'API — qui a lancé un job d'entraînement, qui a mis à jour un point de terminaison, qui a téléchargé des artefacts de modèle depuis S3.
Pourquoi il est à l'examen : Les scénarios de conformité du Domaine 4 citent CloudTrail comme la trace immuable nécessaire pour répondre à « qui a déployé ce modèle » et « quand les données d'entraînement ont-elles été consultées ».

Impact sur la carrière

Rôles typiques

Ingénieur en Machine Learning
Ingénieur MLOps
Ingénieur de plateforme IA/ML
Scientifique de données (orienté ingénierie)
Architecte de solutions ML AWS
Ingénieur en applications IA
Consultant ML Cloud

Fourchette de salaires (É.-U., approximatif)

$120k–$165k–$230k USD annuel

Demande du marché

Prérequis et parcours recommandé

Difficulté et temps d'étude

Historique des versions de l'examen

MLA-C012024-08
Disponibilité générale initiale. L'examen bêta a eu lieu mi-2024. Remplace l'ancienne certification Machine Learning Specialty (MLS-C01) pour les candidats axés sur l'ingénierie. Version actuelle à partir d'avril 2026.