AWS Certified Machine Learning Engineer Associate
275 questions de pratique
Dernière révision : April 2026
Notes personnelles et liens de ressources pour votre parcours d'étude
Filtrer par Certification
La certification AWS Certified Machine Learning Engineer Associate (MLA-C01) a été lancée en août 2024 en tant qu'équivalent axé sur la pratique de l'ancienne certification Machine Learning Specialty. Elle valide la capacité à construire, déployer, surveiller et maintenir des charges de travail ML sur AWS — avec un fort accent sur Amazon SageMaker, les outils MLOps et les cycles de vie des modèles en production. L'examen s'adresse aux ingénieurs ML en début et milieu de carrière, aux scientifiques de données s'orientant vers l'ingénierie et aux ingénieurs DevOps s'étendant aux plateformes ML. Attendez-vous à des questions basées sur des scénarios concernant les pipelines de fonctionnalités, les registres de modèles, les modèles de déploiement, la détection de dérive et l'inférence soucieuse des coûts. L'examen est conceptuel et sans pratique (pas de laboratoires), mais suppose que le candidat a réellement mis des modèles en production.
Le domaine le plus important, représentant 28%. SageMaker Data Wrangler, Feature Store, Glue et les modèles de lac de données S3. Attendez-vous à des questions sur la gestion des données déséquilibrées, des fuites, des stratégies d'encodage et de l'ingénierie des fonctionnalités à grande échelle.
Tâches d'entraînement SageMaker, algorithmes intégrés vs. apport de votre propre conteneur, JumpStart, optimisation des hyperparamètres et évaluation de modèles. Piège courant : choisir entre SageMaker Autopilot, Canvas et l'entraînement personnalisé.
Points de terminaison SageMaker (temps réel, asynchrone, sans serveur, transformation par lots), Pipelines, Model Registry et CI/CD avec CodePipeline. Les candidats manquent souvent les différences subtiles entre les modes de déploiement et leurs compromis en termes de coûts.
SageMaker Model Monitor, Clarify (biais et explicabilité), détection de dérive et modèles IAM/VPC pour les charges de travail ML. Teste davantage la maîtrise pratique des MLOps que la théorie.
Les services que vous rencontrerez à l'examen et pourquoi chacun compte.
Plateforme ML de bout en bout couvrant les notebooks, les jobs d'entraînement, l'optimisation des hyperparamètres, les jobs de traitement, les points de terminaison d'inférence managés et les pipelines MLOps.
Pourquoi il est à l'examen : SageMaker est le service englobant les quatre domaines du MLA-C01 — attendez-vous à des questions sur les choix d'infrastructure d'entraînement, les options de déploiement d'inférence et les compromis entre managé et auto-hébergé.
IDE web pour le ML — notebooks Jupyter, expériences, Pipelines, Model Registry, JumpStart et Canvas réunis dans un seul espace de travail.
Pourquoi il est à l'examen : Le Domaine 2 (Développement de modèles ML) évalue Studio comme la surface unifiée pour itérer sur les modèles, déboguer l'entraînement et promouvoir les artefacts.
Catalogue de modèles de fondation et de modèles spécifiques à une tâche pré-entraînés, avec déploiement en un clic, notebooks d'apprentissage par transfert et flux de fine-tuning.
Pourquoi il est à l'examen : JumpStart est la réponse canonique lorsqu'une question demande comment partir d'un modèle préconstruit plutôt que d'entraîner depuis zéro — pertinent dans le Domaine 2.
Outil de détection de biais et d'explicabilité qui produit des attributions de features SHAP ainsi que des métriques de biais avant et après entraînement sur des modèles tabulaires et de fondation.
Pourquoi il est à l'examen : Les questions des Domaines 2 et 4 sur l'IA responsable, l'explicabilité des modèles et les audits d'équité désignent Clarify comme la réponse AWS native.
Vérifie en continu les points de terminaison déployés pour détecter la dérive de qualité des données, la dérive de qualité du modèle, la dérive de biais et la dérive d'attribution de features par rapport à une référence.
Pourquoi il est à l'examen : Le Domaine 4 (Surveillance, maintenance et sécurité) évalue régulièrement comment détecter et répondre à la dérive en production — Model Monitor est le service nommé.
Dépôt managé pour les features ML avec stockages en ligne (faible latence) et hors ligne (par lots) synchronisés, exactitude point-in-time et réutilisation des features entre modèles.
Pourquoi il est à l'examen : Le Domaine 1 (Préparation des données) évalue Feature Store comme le moyen canonique d'éviter le décalage entraînement/service et de partager les features entre équipes.
Orchestrateur MLOps natif pour SageMaker — enchaîne le prétraitement, l'entraînement, l'évaluation, l'enregistrement du modèle et le déploiement conditionnel sous forme de DAG versionné.
Pourquoi il est à l'examen : Le Domaine 3 (Déploiement et orchestration) insiste sur les pipelines de bout en bout reproductibles ; Pipelines est le choix AWS natif face aux orchestrateurs génériques pour les stacks centrées sur SageMaker.
Outil visuel de préparation de données dans Studio pour importer depuis S3, Athena, Redshift, Snowflake et appliquer plus de 300 transformations intégrées en un clic.
Pourquoi il est à l'examen : Les questions du Domaine 1 sur le feature engineering et l'analyse exploratoire de données désignent fréquemment Data Wrangler comme la réponse low-code pour la préparation tabulaire.
Stockage d'objets servant de data lake pour les jeux de données d'entraînement, les artefacts de modèle, les entrées/sorties d'inférence et les données hors ligne de SageMaker Feature Store.
Pourquoi il est à l'examen : Chaque scénario MLA-C01 de préparation de données et de déploiement de modèle suppose S3 comme substrat de données ; les classes de stockage, les politiques de cycle de vie et les schémas d'accès apparaissent dans les Domaines 1 et 4.
Service ETL serverless avec un runtime Spark managé, un Data Catalog, des crawlers pour la découverte de schémas et Glue DataBrew pour la transformation low-code.
Pourquoi il est à l'examen : Le Domaine 1 désigne Glue comme l'outil ETL/catalogue de données par défaut pour amener les données brutes dans la forme attendue par l'entraînement SageMaker.
Moteur SQL interactif serverless sur S3 (et sources fédérées), utilisant le Data Catalog de Glue pour le schéma et une tarification au paiement par requête.
Pourquoi il est à l'examen : Athena est la réponse attendue lorsqu'une question demande comment exécuter du SQL ad hoc sur des données d'entraînement S3 sans démarrer de cluster — courant dans le Domaine 1.
Plateforme Hadoop/Spark managée pour le traitement de données à grande échelle, prenant en charge Spark MLlib, Hive, Presto et l'intégration EMR de SageMaker Studio.
Pourquoi il est à l'examen : EMR apparaît dans les scénarios du Domaine 1 qui dépassent l'échelle de Glue ou qui nécessitent des pipelines Spark MLlib en dehors de SageMaker.
Service de streaming de données en temps réel pour ingérer à grande échelle les clickstreams, événements IoT et logs, rejouables pendant la durée de rétention.
Pourquoi il est à l'examen : Les questions du Domaine 1 sur l'ingestion de features en streaming (détection de fraude, fraîcheur des recommandations) désignent Kinesis comme la réponse AWS native.
Compute serverless pour l'inférence pilotée par événement, le prétraitement léger, les déclencheurs d'événements S3 et l'enchaînement d'appels SageMaker dans des workflows métier.
Pourquoi il est à l'examen : Les scénarios de déploiement du Domaine 3 distinguent les compromis « hébergement sur point de terminaison SageMaker » vs « emballage dans Lambda » — les questions de coût, de démarrage à froid et de taille de payload sont courantes.
Registre de conteneurs managé pour les images Docker que les jobs d'entraînement SageMaker, les jobs de traitement et les points de terminaison d'inférence récupèrent à l'exécution.
Pourquoi il est à l'examen : Le Domaine 3 évalue les flux BYOC (bring-your-own-container) pour l'entraînement/inférence personnalisé — ECR est le registre de stockage nommé, intégré à IAM.
Orchestrateur de workflows serverless avec intégrations SageMaker natives pour l'entraînement, la transformation par lots, le déploiement de points de terminaison et la composition d'étapes Lambda.
Pourquoi il est à l'examen : Distinguer Step Functions (orchestration multi-services) de SageMaker Pipelines (MLOps natif SageMaker) est un schéma de distracteur récurrent dans le Domaine 3.
Contrôle d'accès à l'échelle du compte : utilisateurs, rôles, politiques, fédération et permissions de moindre privilège pour chaque action SageMaker, S3 et de pipeline.
Pourquoi il est à l'examen : Le Domaine 4 (Sécurité) évalue les rôles d'exécution IAM pour l'entraînement/inférence, le partage de modèles entre comptes et les politiques basées sur les ressources sur le data lake.
Création et contrôle managés des clés cryptographiques utilisées pour chiffrer les données d'entraînement, les artefacts de modèle, les volumes EBS des instances d'entraînement et les payloads des points de terminaison.
Pourquoi il est à l'examen : Le chiffrement au repos avec des clés gérées par le client est la réponse canonique du Domaine 4 pour protéger les corpus d'entraînement sensibles et la propriété intellectuelle des modèles.
Métriques, logs et alarmes pour les invocations de points de terminaison SageMaker, la progression des jobs d'entraînement, les métriques de modèle personnalisées et les durées d'étapes de pipeline.
Pourquoi il est à l'examen : Le Domaine 4 attend CloudWatch pour les alarmes de latence/erreur des points de terminaison, le dépannage des logs de jobs d'entraînement et la remontée des résultats de Model Monitor vers les équipes ops.
Journal d'audit à l'échelle du compte de chaque appel d'API — qui a lancé un job d'entraînement, qui a mis à jour un point de terminaison, qui a téléchargé des artefacts de modèle depuis S3.
Pourquoi il est à l'examen : Les scénarios de conformité du Domaine 4 citent CloudTrail comme la trace immuable nécessaire pour répondre à « qui a déployé ce modèle » et « quand les données d'entraînement ont-elles été consultées ».
$120k–$165k–$230k USD annuel
La fourchette couvre les rôles d'ingénieurs ML de niveau intermédiaire à senior basés aux États-Unis où la maîtrise d'AWS est requise. Les ingénieurs ML seniors des FAANG / licornes dépassent fréquemment les 300 000 $ en rémunération totale. Les marchés d'entrée de gamme et hors zones côtières tendent à être plus bas. La certification seule n'augmente pas le salaire — elle complète un portefeuille de systèmes ML mis en production.
Source : rôles d'ingénieurs ML 2025–2026 selon levels.fyi, U.S. BLS OEWS mai 2024 (15-2051 data scientists, 15-1252 software developers). Les chiffres sont approximatifs ; la rémunération réelle dépend du rôle, de la région et de l'expérience.
La demande pour les ingénieurs ML capables de mettre des modèles en production — et pas seulement de les entraîner dans des notebooks — s'est accélérée de 2024 à 2026 à mesure que les entreprises ont opérationnalisé la GenAI et les charges de travail ML classiques. Le MLA-C01 fonctionne comme un signal crédible qu'un candidat comprend SageMaker de bout en bout et peut gérer les compromis MLOps. Les recruteurs dans les entreprises axées sur AWS (services financiers, santé, équipes de données de vente au détail) l'utilisent comme filtre de sélection aux côtés de l'expérience Python et PyTorch/TensorFlow. Il s'associe naturellement avec l'AI Practitioner (AIF-C01) et le Data Engineer Associate (DEA-C01) pour un profil de données et ML plus large. Il ne qualifie PAS à lui seul les candidats pour des rôles de recherche en ML, des postes de spécialiste en apprentissage profond ou des titres d'architecte de plateforme ML — ces postes exigent une expérience de plusieurs années avec des systèmes mis en production, souvent complétée par un diplôme universitaire supérieur.
Il n'y a pas de prérequis formels. AWS recommande au moins un an d'expérience pratique avec SageMaker et les flux de travail ML, ainsi qu'une connaissance pratique de Python, des bibliothèques ML courantes (scikit-learn, pandas, PyTorch ou TensorFlow) et des statistiques de base.
Le chemin le plus efficace est de passer d'abord l'AIF-C01 (vocabulaire fondamental de l'IA), puis de construire un petit projet SageMaker de bout en bout — feature store, tâche d'entraînement, registre de modèles, point de terminaison en temps réel, monitoring — avant de passer le MLA-C01. Les candidats ayant une expérience Cloud Practitioner (CLF-C02) ou Solutions Architect Associate (SAA-C03) trouvent les questions sur les services AWS beaucoup plus faciles. Un pur profil de data scientist sans exposition à AWS est le point de départ le plus difficile et nécessite généralement plus de 80 heures d'étude supplémentaire spécifique aux services.
Le MLA-C01 est classé Associé et est significativement plus difficile que l'AIF-C01 car il suppose une maîtrise pratique de SageMaker. Prévoyez 80 à 120 heures sur 8 à 12 semaines si vous avez une expérience ML préalable mais une exposition limitée à AWS ; 40 à 60 heures sur 4 à 6 semaines si vous travaillez déjà quotidiennement sur des pipelines ML AWS. L'examen comprend 65 questions notées en 170 minutes — questions à choix multiples et à réponses multiples, pas de laboratoires.
Le piège le plus courant est l'étendue des sous-services SageMaker (Studio, Pipelines, Feature Store, Model Registry, Clarify, Model Monitor, JumpStart, Canvas, Autopilot, Ground Truth) — les questions reposent souvent sur le choix du bon outil pour un scénario contraint. Le second piège concerne les modes de déploiement : savoir précisément quand utiliser les points de terminaison temps réel, asynchrone, sans serveur ou de transformation par lots, ainsi que les compromis de coût et de latence de chacun.
Disponibilité générale initiale. L'examen bêta a eu lieu mi-2024. Remplace l'ancienne certification Machine Learning Specialty (MLS-C01) pour les candidats axés sur l'ingénierie. Version actuelle à partir d'avril 2026.
MLA-C01 (AWS Certified Machine Learning Engineer Associate) est un examen de niveau Associate un examen de difficulté modérée exigeant une expérience pratique concrète ainsi qu'une solide compréhension des meilleures pratiques. La plupart des candidats ont besoin de 80 à 150 heures d'étude réparties sur 6 à 12 semaines pour les examens de niveau associé. La plupart des candidats qui obtiennent des scores constamment supérieurs au seuil de réussite lors des examens pratiques réussissent dès leur première tentative.
La plupart des candidats ont besoin de 80 à 150 heures d'étude réparties sur 6 à 12 semaines pour les examens de niveau associé. Le temps nécessaire pour réussir varie considérablement en fonction de l'expérience antérieure. Les ingénieurs ayant une expérience pratique en production avec la technologie sous-jacente en ont généralement besoin de moins ; les candidats novices sur la plateforme devraient viser la limite supérieure de cette fourchette.
MLA-C01 est une certification reconnue dans l'écosystème AWS et signale des connaissances validées aux employeurs, recruteurs et clients. Sa valeur en termes de temps et de coût dépend de votre rôle et de vos objectifs — elle est la plus avantageuse pour les ingénieurs cloud, architectes et consultants qui travaillent quotidiennement avec AWS ou souhaitent évoluer vers des rôles similaires.
Le score de réussite pour le MLA-C01 est de 720 / 1000. L'examen contient 65 questions et dure 2 h 50 min.
Les frais d'examen MLA-C01 sont de $150 USD. Les frais sont fixés par AWS et peuvent varier selon la région ; confirmez toujours le prix actuel sur la page de certification officielle de AWS avant de réserver.
Les certifications AWS sont valides pendant 3 ans. Recertifiez-vous en réussissant la version actuelle du même examen, ou en réussissant un examen de niveau supérieur dans le même parcours avant l'expiration.
Oui. Vous pouvez passer l'examen en ligne (supervisé via le navigateur sécurisé du fournisseur, disponible 24h/24 et 7j/7 dans la plupart des régions) ou dans un centre de test Pearson VUE en personne pendant les heures ouvrables. Les deux formats utilisent les mêmes questions, la même limite de temps et le même score de réussite.
CertLabPro propose 15 modes d'étude à travers la banque de questions pratiques pour le MLA-C01. Le mode de simulation d'examen reproduit l'examen réel : 65 questions en 2 h 50 min, avec le même seuil de réussite de 720 / 1000. Le mode navigation vous permet de lire chaque Q&A de manière statique.