AWS Certified Machine Learning Engineer Associate
275 практических вопросов
Последняя проверка: April 2026
Личные заметки и ссылки на ресурсы для вашего учебного пути
Фильтр по сертификации
Сертификация AWS Certified Machine Learning Engineer Associate (MLA-C01) была запущена в августе 2024 года как ориентированный на практиков аналог более старой специализации Machine Learning Specialty. Она подтверждает способность создавать, развертывать, мониторить и поддерживать рабочие нагрузки ML в AWS — с сильным акцентом на Amazon SageMaker, инструментарий MLOps и жизненные циклы производственных моделей. Экзамен предназначен для ML-инженеров на начальном и среднем этапах карьеры, специалистов по данным, переходящих в инженерию, и инженеров DevOps, расширяющих свои знания в области ML-платформ. Ожидайте вопросов, основанных на сценариях, о конвейерах признаков, реестрах моделей, шаблонах развертывания, обнаружении дрейфа и выводе с учетом стоимости. Экзамен концептуальный и не требует практических навыков (без лабораторий), но предполагает, что кандидат уже внедрял модели в производство.
Самая большая область, 28%. SageMaker Data Wrangler, Feature Store, Glue и шаблоны озер данных S3. Ожидайте вопросов по обработке несбалансированных данных, утечке данных, стратегиям кодирования и проектированию признаков в масштабе.
Задания SageMaker для обучения, встроенные алгоритмы против собственного контейнера, JumpStart, настройка гиперпараметров и оценка модели. Распространенное затруднение: выбор между SageMaker Autopilot, Canvas и пользовательским обучением.
Конечные точки SageMaker (в реальном времени, асинхронные, бессерверные, пакетное преобразование), Pipelines, Model Registry и CI/CD с CodePipeline. Кандидаты часто упускают тонкие различия между режимами развертывания и их компромиссы по стоимости.
SageMaker Model Monitor, Clarify (предвзятость и объяснимость), обнаружение дрейфа и шаблоны IAM/VPC для рабочих нагрузок ML. Проверяет практическую компетентность в MLOps больше, чем теорию.
Сервисы, с которыми вы столкнётесь на экзамене, и почему каждый из них важен.
Сквозная ML-платформа, охватывающая ноутбуки, обучающие задания, подбор гиперпараметров, задания обработки данных, управляемые конечные точки для инференса и MLOps-пайплайны.
Почему он на экзамене: SageMaker — зонтичный сервис, покрывающий все четыре домена MLA-C01: ожидайте вопросов о выборе инфраструктуры обучения, вариантах развёртывания инференса и компромиссах между управляемым и self-hosted-подходами.
Веб-IDE для ML — Jupyter-ноутбуки, эксперименты, Pipelines, Model Registry, JumpStart и Canvas в едином рабочем пространстве.
Почему он на экзамене: Домен 2 (Разработка ML-моделей) проверяет Studio как унифицированную поверхность для итераций над моделями, отладки обучения и продвижения артефактов.
Каталог предобученных базовых и задачеспецифичных моделей с развёртыванием в один клик, ноутбуками для transfer learning и сценариями дообучения.
Почему он на экзамене: JumpStart — канонический ответ, когда вопрос спрашивает, как стартовать с готовой модели вместо обучения с нуля, что актуально для Домена 2.
Инструмент детекции смещений и интерпретируемости, который выдаёт SHAP-атрибуции признаков плюс метрики смещения до и после обучения для табличных и базовых моделей.
Почему он на экзамене: Вопросы Домена 2 и Домена 4 про ответственный ИИ, интерпретируемость моделей и аудит справедливости называют Clarify как нативное AWS-решение.
Непрерывно проверяет развёрнутые эндпоинты на дрейф качества данных, качества модели, смещений и атрибуций признаков относительно базовой линии.
Почему он на экзамене: Домен 4 (Мониторинг, обслуживание и безопасность) неоднократно проверяет, как обнаруживать и реагировать на дрейф в продакшене — Model Monitor назван прямо.
Управляемое хранилище ML-признаков с синхронизированными онлайн- (низколатентным) и офлайн- (батч) хранилищами, point-in-time-корректностью и переиспользованием признаков между моделями.
Почему он на экзамене: Домен 1 (Подготовка данных) проверяет Feature Store как канонический способ избежать training/serving skew и делиться признаками между командами.
Нативный MLOps-оркестратор для SageMaker, связывающий предобработку, обучение, оценку, регистрацию моделей и условное развёртывание в виде версионированного DAG.
Почему он на экзамене: Домен 3 (Развёртывание и оркестрация) подчёркивает воспроизводимые сквозные пайплайны; для SageMaker-центричных стэков Pipelines — выбор AWS поверх универсальных оркестраторов.
Визуальный инструмент подготовки данных внутри Studio для импорта из S3, Athena, Redshift, Snowflake и применения 300+ встроенных трансформаций в один клик.
Почему он на экзамене: Вопросы Домена 1 по feature engineering и разведочному анализу данных часто называют Data Wrangler как low-code-ответ для подготовки табличных данных.
Объектное хранилище, играющее роль озера данных для обучающих наборов, артефактов моделей, входов/выходов инференса и офлайн-данных SageMaker Feature Store.
Почему он на экзамене: Каждый сценарий подготовки данных и развёртывания моделей в MLA-C01 предполагает S3 как основу хранения; классы хранения, lifecycle-политики и паттерны доступа всплывают в Доменах 1 и 4.
Бессерверный ETL-сервис с управляемым Spark-рантаймом, Data Catalog, краулерами для обнаружения схем и Glue DataBrew для low-code-трансформаций.
Почему он на экзамене: Домен 1 называет Glue инструментом ETL/каталога данных по умолчанию для приведения сырых данных к форме, ожидаемой обучением в SageMaker.
Бессерверный интерактивный SQL-движок поверх S3 (и федеративных источников), использующий Glue Data Catalog для схем и оплату за запрос.
Почему он на экзамене: Athena — ожидаемый ответ, когда вопрос спрашивает, как выполнять ad-hoc SQL-запросы к обучающим данным в S3 без поднятия кластера, что часто встречается в Домене 1.
Управляемая Hadoop/Spark-платформа для крупномасштабной обработки данных с поддержкой Spark MLlib, Hive, Presto и интеграции SageMaker Studio с EMR.
Почему он на экзамене: EMR встречается в сценариях Домена 1, выходящих за пределы масштаба Glue или требующих пайплайнов Spark MLlib вне SageMaker.
Сервис потоковой передачи данных в реальном времени для приёма clickstream, IoT- и логовых событий в большом объёме с возможностью повтора в пределах окна хранения.
Почему он на экзамене: Вопросы Домена 1 о потоковом приёме признаков (например, обнаружение мошенничества, свежесть рекомендаций) называют Kinesis как нативный AWS-ответ.
Бессерверные вычисления для event-driven-инференса, лёгкой предобработки, S3-триггеров и встраивания вызовов SageMaker в бизнес-процессы.
Почему он на экзамене: Сценарии развёртывания в Домене 3 различают компромиссы «хостинг на эндпоинте SageMaker» и «оборачивание в Lambda» — типичны вопросы о стоимости, cold start и размере полезной нагрузки.
Управляемый реестр контейнеров для Docker-образов, которые обучающие задания, задания обработки и эндпоинты инференса SageMaker подтягивают на этапе выполнения.
Почему он на экзамене: Домен 3 проверяет BYOC-сценарии для кастомного обучения и инференса — ECR назван хранилищем образов и реестром, интегрированным с IAM.
Бессерверный оркестратор рабочих процессов с нативными интеграциями SageMaker для обучения, batch transform, развёртывания эндпоинтов и композиции шагов с Lambda.
Почему он на экзамене: Разделение Step Functions (мультисервисная оркестрация) и SageMaker Pipelines (нативный MLOps SageMaker) — повторяющийся паттерн дистракторов в Домене 3.
Контроль доступа на уровне аккаунта: пользователи, роли, политики, федерация и least-privilege-разрешения для каждого действия SageMaker, S3 и пайплайнов.
Почему он на экзамене: Домен 4 (Безопасность) проверяет execution-роли IAM для обучения и инференса, межаккаунтное использование моделей и resource-based-политики на озере данных.
Управляемое создание и контроль криптографических ключей для шифрования обучающих данных, артефактов моделей, EBS-томов на обучающих инстансах и payload-ов эндпоинтов.
Почему он на экзамене: Шифрование данных в покое с использованием customer-managed-ключей — канонический ответ Домена 4 для защиты чувствительных обучающих корпусов и интеллектуальной собственности моделей.
Метрики, логи и алармы для вызовов эндпоинтов SageMaker, прогресса обучающих заданий, кастомных метрик моделей и длительности шагов пайплайна.
Почему он на экзамене: Домен 4 ожидает CloudWatch для алармов по латентности и ошибкам эндпоинтов, разбора логов обучающих заданий и доставки находок Model Monitor ops-командам.
Аккаунт-уровневый журнал аудита всех вызовов API — кто запустил обучающее задание, кто обновил эндпоинт, кто скачал артефакты моделей из S3.
Почему он на экзамене: Сценарии комплаенса в Домене 4 называют CloudTrail неизменяемой записью, нужной чтобы ответить на вопросы «кто развернул эту модель» и «когда обращались к обучающим данным».
$120k–$165k–$230k USD годовая
Диапазон охватывает должности MLE среднего и высшего уровня в США, где требуется владение AWS. Старшие MLE в FAANG / компаниях-единорогах часто превышают $300 тыс. TC. Рынки начального уровня и не прибрежных регионов показывают более низкие показатели. Сам по себе сертификат не повышает зарплату — он дополняет портфолио внедренных ML-систем.
Источник: роли ML-инженеров levels.fyi 2025–2026, U.S. BLS OEWS May 2024 (15-2051 data scientists, 15-1252 software developers). Цифры приблизительны; фактическая компенсация зависит от роли, региона и опыта.
Спрос на ML-инженеров, способных внедрять модели в производство — а не просто обучать их в ноутбуках — ускорился в 2024–2026 годах, поскольку предприятия начали операционализировать GenAI и классические ML-нагрузки. MLA-C01 служит надежным сигналом того, что кандидат понимает SageMaker от начала до конца и может управлять компромиссами MLOps. Рекрутеры в компаниях, ориентированных на AWS (финансовые услуги, здравоохранение, команды данных розничной торговли), используют его в качестве фильтра отбора наряду с опытом работы с Python и PyTorch/TensorFlow. Он естественным образом сочетается с AI Practitioner (AIF-C01) и Data Engineer Associate (DEA-C01) для более широкого профиля данных и ML. Сам по себе он НЕ квалифицирует кандидатов на роли в ML-исследованиях, должности специалистов по глубокому обучению или архитекторов ML-платформ — для них требуется многолетний опыт работы с внедренными системами, а часто и ученая степень.
Формальных предварительных требований нет. AWS рекомендует иметь не менее одного года практического опыта работы с SageMaker и ML-процессами, а также рабочие знания Python, распространенных ML-библиотек (scikit-learn, pandas, PyTorch или TensorFlow) и базовой статистики.
Наиболее эффективный путь — сначала сдать AIF-C01 (основополагающий словарь ИИ), затем создать небольшой сквозной проект SageMaker — хранилище признаков, задание на обучение, реестр моделей, конечную точку реального времени, мониторинг — прежде чем сдавать MLA-C01. Кандидатам с опытом Cloud Practitioner (CLF-C02) или Solutions Architect Associate (SAA-C03) вопросы по сервисам AWS даются гораздо легче. Чистое образование в области Data Science без опыта работы с AWS является самой сложной отправной точкой и обычно требует более 80 часов дополнительного изучения конкретных сервисов.
MLA-C01 имеет уровень Associate и значительно сложнее, чем AIF-C01, поскольку предполагает практическое владение SageMaker. Запланируйте 80–120 часов в течение 8–12 недель, если у вас есть предыдущий опыт ML, но ограниченный опыт работы с AWS; 40–60 часов в течение 4–6 недель, если вы ежедневно работаете с конвейерами AWS ML. Экзамен состоит из 65 вопросов, оцениваемых в течение 170 минут — множественный выбор и множественный ответ, без лабораторных работ.
Наиболее распространенным камнем преткновения является широкий спектр подсервисов SageMaker (Studio, Pipelines, Feature Store, Model Registry, Clarify, Model Monitor, JumpStart, Canvas, Autopilot, Ground Truth) — вопросы часто зависят от выбора правильного инструмента для ограниченного сценария. Вторая ловушка — режимы развертывания: точное знание того, когда использовать конечные точки реального времени, асинхронные, бессерверные или пакетные преобразования, а также компромиссы по стоимости и задержке для каждого из них.
Первоначальная общая доступность. Бета-экзамен проводился в середине 2024 года. Заменяет старую специализацию Machine Learning Specialty (MLS-C01) для кандидатов, ориентированных на инженерию. Актуальная версия по состоянию на апрель 2026 года.
MLA-C01 (AWS Certified Machine Learning Engineer Associate) — это Associate-уровневый экзамен, экзамен средней сложности, требующий практического опыта и глубокого понимания лучших практик. Большинству кандидатов требуется 80–150 часов обучения, распределенных на 6–12 недель, для экзаменов уровня Associate. Большинство кандидатов, которые стабильно набирают баллы выше проходного порога на пробных экзаменах, сдают его с первой попытки.
Большинству кандидатов требуется 80–150 часов обучения, распределенных на 6–12 недель, для экзаменов уровня Associate. Время, необходимое для сдачи, сильно варьируется в зависимости от предыдущего опыта. Инженерам с практическим опытом работы с базовой технологией обычно требуется меньше времени; кандидатам, новым для платформы, следует ориентироваться на верхнюю границу этого диапазона.
MLA-C01 — это признанная квалификация в экосистеме AWS, которая подтверждает знания для работодателей, рекрутеров и клиентов. Стоит ли это затраченного времени и платы, зависит от вашей роли и целей — это чаще всего окупается для облачных инженеров, архитекторов и консультантов, которые ежедневно работают с AWS или хотят перейти на такие должности.
Проходной балл для MLA-C01 составляет 720 / 1000. Экзамен содержит 65 вопросов и длится 2 ч 50 мин.
Стоимость экзамена MLA-C01 составляет $150 USD. Сборы устанавливаются AWS и могут варьироваться в зависимости от региона; всегда уточняйте текущую цену на официальной странице сертификации AWS перед бронированием.
Сертификации AWS действительны в течение 3 лет. Пройдите повторную сертификацию, сдав текущую версию того же экзамена или сдав экзамен более высокого уровня в том же направлении до истечения срока действия.
Да. Вы можете сдать экзамен онлайн (с прокторингом через безопасный браузер провайдера, доступный 24/7 в большинстве регионов) или в очном центре тестирования Pearson VUE в рабочее время. Оба формата используют одни и те же вопросы, ограничение по времени и проходной балл.
CertLabPro предлагает 15 режимов обучения по банку практических вопросов для MLA-C01. Режим симуляции экзамена имитирует реальный экзамен: 65 вопросов за 2 ч 50 мин, с тем же проходным порогом 720 / 1000. Режим просмотра позволяет статически читать каждый вопрос и ответ.