AWS Certified Machine Learning Engineer Associate
275道练习题
最后审核:April 2026
为你的学习之旅记录个人笔记和资源链接
按认证筛选
AWS 认证机器学习工程师助理 (MLA-C01) 于 2024 年 8 月发布,是旧版机器学习专业认证的面向实践者的对应版本。它验证了在 AWS 上构建、部署、监控和维护 ML 工作负载的能力——特别强调 Amazon SageMaker、MLOps 工具和生产模型生命周期。该考试面向职业早期和中期的 ML 工程师、转向工程领域的数据科学家以及扩展到 ML 平台的 DevOps 工程师。预计会有关于特征管道、模型注册表、部署模式、漂移检测和成本感知推理的场景驱动型问题。该考试是概念性的,不涉及动手操作(无实验),但假定考生已实际将模型投入生产。
占比最大的领域,为 28%。涵盖 SageMaker Data Wrangler、Feature Store、Glue 和 S3 数据湖模式。预计会有关于处理不平衡数据、数据泄露、编码策略和大规模特征工程的问题。
SageMaker 训练任务、内置算法与自带容器、JumpStart、超参数调优和模型评估。常见难点:在 SageMaker Autopilot、Canvas 和自定义训练之间进行选择。
SageMaker 端点(实时、异步、无服务器、批量转换)、Pipelines、Model Registry 以及使用 CodePipeline 进行 CI/CD。考生经常会忽略部署模式及其成本权衡之间的细微差异。
SageMaker Model Monitor、Clarify(偏见和可解释性)、漂移检测以及适用于 ML 工作负载的 IAM/VPC 模式。它更侧重于测试实际的 MLOps 熟练度而非理论。
您将在考试中遇到的服务及其重要性。
端到端 ML 平台,涵盖笔记本、训练作业、超参数调优、处理作业、托管推理端点和 MLOps 流水线。
为什么会出现在考试中: SageMaker 是贯穿 MLA-C01 全部四个领域的核心服务——重点考查训练基础设施选型、推理部署选项,以及托管 vs 自托管的权衡。
基于 Web 的 ML 集成开发环境——Jupyter 笔记本、实验、Pipelines、Model Registry、JumpStart 和 Canvas 集中在同一工作区。
为什么会出现在考试中: 领域 2(ML 模型开发)将 Studio 作为统一界面来考查模型迭代、训练调试和模型工件晋升流程。
预训练基础模型和任务专用模型的目录,提供一键部署、迁移学习笔记本和微调工作流。
为什么会出现在考试中: 当题目询问如何基于预构建模型起步而非从零训练时,JumpStart 是领域 2 的标准答案。
偏差检测和可解释性工具,可输出 SHAP 特征归因以及表格数据和基础模型的训练前/训练后偏差指标。
为什么会出现在考试中: 领域 2 与领域 4 中涉及负责任 AI、模型可解释性和公平性审计的题目,都将 Clarify 作为 AWS 原生答案。
持续对照基线检查已部署端点的数据质量漂移、模型质量漂移、偏差漂移和特征归因漂移。
为什么会出现在考试中: 领域 4(监控、维护与安全)反复考查如何在生产中发现并响应漂移——Model Monitor 是题面点名的服务。
ML 特征的托管仓库,提供同步的在线(低延迟)与离线(批处理)存储、时间点正确性以及跨模型的特征复用。
为什么会出现在考试中: 领域 1(数据准备)以 Feature Store 作为避免训练/推理偏移、跨团队共享特征的标准方案。
SageMaker 原生 MLOps 编排器——以版本化 DAG 串联预处理、训练、评估、模型注册和条件部署。
为什么会出现在考试中: 领域 3(部署与编排)强调可重复的端到端流水线;在以 SageMaker 为主的技术栈中,Pipelines 优于通用步骤编排器,是 AWS 原生答案。
Studio 内置的可视化数据准备工具,可从 S3、Athena、Redshift、Snowflake 导入数据,并一键应用 300 多种内置转换。
为什么会出现在考试中: 领域 1 中关于特征工程和探索性数据分析的题目,常将 Data Wrangler 作为表格数据准备的低代码答案。
对象存储,作为数据湖承载训练数据集、模型工件、推理输入/输出,以及 SageMaker Feature Store 的离线数据。
为什么会出现在考试中: MLA-C01 的每个数据准备和模型部署场景都默认 S3 为数据底座;存储类、生命周期策略和访问模式在领域 1 与领域 4 中频繁出现。
无服务器 ETL 服务,提供托管的 Spark 运行时、Data Catalog、用于模式发现的爬网程序,以及用于低代码转换的 Glue DataBrew。
为什么会出现在考试中: 领域 1 将 Glue 列为默认的 ETL/数据目录工具,用于把原始数据整理成 SageMaker 训练所需的形态。
面向 S3(及联邦数据源)的无服务器交互式 SQL 引擎,使用 Glue Data Catalog 管理模式并按查询计费。
为什么会出现在考试中: 当题目询问如何在不启动集群的情况下对 S3 训练数据运行临时 SQL 时,Athena 是预期答案——在领域 1 中很常见。
托管的 Hadoop/Spark 大规模数据处理平台,支持 Spark MLlib、Hive、Presto,并集成 SageMaker Studio EMR。
为什么会出现在考试中: 当场景超出 Glue 的处理规模、或需要在 SageMaker 之外运行 Spark MLlib 流水线时,EMR 会出现在领域 1 题目中。
实时数据流服务,可大规模摄取点击流、IoT 和日志事件,并在保留窗口内可重放。
为什么会出现在考试中: 领域 1 中涉及流式特征摄取(如欺诈检测、推荐新鲜度)的题目,将 Kinesis 列为 AWS 原生答案。
无服务器计算,用于事件驱动的推理、轻量级预处理、S3 事件触发,以及将 SageMaker 调用拼接到业务工作流中。
为什么会出现在考试中: 领域 3 的部署场景常考"托管在 SageMaker 端点"与"封装到 Lambda"之间的取舍——成本、冷启动和负载大小是常见考点。
托管容器注册表,存放 SageMaker 训练作业、处理作业和推理端点在运行时拉取的 Docker 镜像。
为什么会出现在考试中: 领域 3 考查自带容器(BYOC)的训练/推理工作流——ECR 是题面点名、与 IAM 集成的镜像存储。
无服务器工作流编排器,原生集成 SageMaker 训练、批量转换、端点部署以及 Lambda 步骤组合。
为什么会出现在考试中: 区分 Step Functions(多服务编排)与 SageMaker Pipelines(SageMaker 原生 MLOps),是领域 3 中反复出现的干扰项套路。
账户级访问控制:用户、角色、策略、联合身份认证,以及对所有 SageMaker、S3 和流水线操作执行最小权限。
为什么会出现在考试中: 领域 4(安全)考查训练/推理的 IAM 执行角色、跨账户模型共享,以及数据湖上的资源型策略。
托管加密密钥的创建与控制,用于加密训练数据、模型工件、训练实例上的 EBS 卷以及端点负载。
为什么会出现在考试中: 使用客户托管密钥实现静态加密,是领域 4 保护敏感训练语料和模型知识产权的标准答案。
提供 SageMaker 端点调用、训练作业进度、自定义模型指标和流水线步骤时长的指标、日志与告警。
为什么会出现在考试中: 领域 4 要求用 CloudWatch 配置端点延迟/错误告警、排查训练作业日志,并将 Model Monitor 的发现上报给运维团队。
账户级 API 调用审计日志——谁启动了训练作业、谁更新了端点、谁从 S3 下载了模型工件。
为什么会出现在考试中: 领域 4 的合规场景将 CloudTrail 作为不可变审计记录,用以回答"谁部署了这个模型"和"训练数据是何时被访问的"。
$120k–$165k–$230k USD 每年
该范围涵盖了需要 AWS 熟练度的美国中高级 MLE 职位。FAANG/独角兽公司的高级 MLE 总薪酬常超过 30 万美元。入门级和非沿海市场薪酬趋势较低。仅凭此证书并不能提升薪水——它与一套已投入生产的 ML 系统组合才能发挥作用。
来源:levels.fyi 2025–2026 年 ML 工程师职位,U.S. BLS OEWS 2024 年 5 月 (15-2051 数据科学家,15-1252 软件开发人员)。数据为估算值;实际薪酬取决于职位、地区和经验。
随着企业将生成式 AI 和经典 ML 工作负载投入运营,2024-2026 年期间,能够将模型投入生产——而不仅仅是在 Jupyter Notebook 中训练模型——的 ML 工程师需求加速增长。MLA-C01 作为一项可靠的信号,表明候选人端到端地理解 SageMaker 并能权衡 MLOps。以 AWS 为核心的公司(金融服务、医疗保健、零售数据团队)的招聘人员将其与 Python 和 PyTorch/TensorFlow 经验一同用作筛选条件。它与 AI Practitioner (AIF-C01) 和 Data Engineer Associate (DEA-C01) 自然搭配,以形成更广泛的数据和 ML 职业档案。它本身不能使候选人胜任 ML 研究职位、深度学习专家职位或 ML 平台架构师职位——这些职位通常需要多年的已投入生产的系统经验,通常还需要研究生学位。
没有正式的先决条件。AWS 建议至少一年 SageMaker 和 ML 工作流的实际操作经验,以及对 Python、常见 ML 库(scikit-learn、pandas、PyTorch 或 TensorFlow)和基本统计学的掌握。
最有效的路径是先通过 AIF-C01(基础 AI 词汇),然后构建一个小型端到端 SageMaker 项目——特征存储、训练任务、模型注册表、实时端点、监控——之后再参加 MLA-C01。具有 Cloud Practitioner (CLF-C02) 或 Solutions Architect Associate (SAA-C03) 背景的考生会觉得 AWS 服务问题容易得多。纯数据科学背景而没有 AWS 经验是学习的起点最困难,通常需要 80 小时以上的额外服务特定学习。
MLA-C01 被评为助理级别,比 AIF-C01 难度更大,因为它假定考生具备 SageMaker 的实际操作熟练度。如果您有 ML 经验但 AWS 接触有限,请计划 8-12 周内学习 80-120 小时;如果您每天都在使用 AWS ML 管道工作,则计划 4-6 周内学习 40-60 小时。考试包含 65 道计分题,时长 170 分钟——多项选择和多项响应,无实验环节。
最常见的障碍是 SageMaker 子服务的广度(Studio、Pipelines、Feature Store、Model Registry、Clarify、Model Monitor、JumpStart、Canvas、Autopilot、Ground Truth)——问题通常取决于在受限场景中选择正确的工具。第二个陷阱是部署模式:精确了解何时使用实时、异步、无服务器或批量转换端点,以及它们各自的成本和延迟权衡。
首次普遍可用。Beta 考试于 2024 年年中进行。对于侧重工程的考生,它取代了旧版机器学习专业认证 (MLS-C01)。截至 2026 年 4 月的当前版本。
MLA-C01 (AWS Certified Machine Learning Engineer Associate) 是一门中等难度的考试,要求具备实际操作经验以及对最佳实践的扎实理解Associate级别考试。大多数考生需要为助理级别考试学习 80-150 小时,分摊在 6-12 周内完成。 大多数在模拟考试中持续得分高于及格线的考生,在第一次尝试时都能通过。
大多数考生需要为助理级别考试学习 80-150 小时,分摊在 6-12 周内完成。 通过考试所需时间因个人经验而异。在底层技术方面具有实际生产经验的工程师通常所需时间较少;平台新手则应计划在学习时间范围的上限。
MLA-C01 是 AWS 生态系统中公认的证书,向雇主、招聘人员和客户表明您已具备经过验证的知识。它是否值得您投入时间和费用取决于您的角色和目标——对于日常使用 AWS 或希望从事相关工作的云工程师、架构师和顾问来说,其回报通常最大。
MLA-C01 的及格分数是 720 / 1000。考试包含 65 道题,时长为 2 小时 50 分钟。
MLA-C01 考试费用为 $150 USD。费用由 AWS 设定,并可能因地区而异;预订前请务必在 AWS 官方认证页面确认当前价格。
AWS 认证有效期为 3 年。在证书过期前,您可以通过通过相同考试的当前版本,或通过同一路径中更高级别的考试来重新认证。
是的。您可以选择在线考试(通过提供商的安全浏览器进行监考,在大多数地区全天候可用)或在工作时间内前往 Pearson VUE 线下考试中心参加。两种形式使用相同的题目、时间限制和及格分数。
CertLabPro 为 MLA-C01 提供了包含 15 种学习模式的练习题库。考试模拟模式与真实考试一致:65 道题,时长 2 小时 50 分钟,及格分数同样为 720 / 1000。浏览模式允许您静态阅读所有问答。