Розничная компания разрабатывает механизм рекомендаций и хранит необработанные данные кликстрима в Amazon S3. Специалисту по анализу данных необходимо изучить, очистить и преобразовать эти данные перед обучением. Команда хочет использовать визуальный интерфейс с минимальным использованием кода для подготовки данных, который интегрируется непосредственно с Amazon SageMaker. Какой сервис AWS следует использовать команде?

Сертификация AWS Certified Machine Learning Engineer Associate (MLA-C01) была запущена в августе 2024 года как ориентированный на практиков аналог более старой специализации Machine Learning Specialty. Она подтверждает способность создавать, развертывать, мониторить и поддерживать рабочие нагрузки ML в AWS — с сильным акцентом на Amazon SageMaker, инструментарий MLOps и жизненные циклы производственных моделей. Экзамен предназначен для ML-инженеров на начальном и среднем этапах карьеры, специалистов по данным, переходящих в инженерию, и инженеров DevOps, расширяющих свои знания в области ML-платформ. Ожидайте вопросов, основанных на сценариях, о конвейерах признаков, реестрах моделей, шаблонах развертывания, обнаружении дрейфа и выводе с учетом стоимости. Экзамен концептуальный и не требует практических навыков (без лабораторий), но предполагает, что кандидат уже внедрял модели в производство.

Экзаменационные домены

Data Preparation for ML28%
Самая большая область, 28%. SageMaker Data Wrangler, Feature Store, Glue и шаблоны озер данных S3. Ожидайте вопросов по обработке несбалансированных данных, утечке данных, стратегиям кодирования и проектированию признаков в масштабе.
ML Model Development26%
Задания SageMaker для обучения, встроенные алгоритмы против собственного контейнера, JumpStart, настройка гиперпараметров и оценка модели. Распространенное затруднение: выбор между SageMaker Autopilot, Canvas и пользовательским обучением.
Deployment and Orchestration of ML Workflows22%
Конечные точки SageMaker (в реальном времени, асинхронные, бессерверные, пакетное преобразование), Pipelines, Model Registry и CI/CD с CodePipeline. Кандидаты часто упускают тонкие различия между режимами развертывания и их компромиссы по стоимости.
ML Solution Monitoring, Maintenance, and Security24%
SageMaker Model Monitor, Clarify (предвзятость и объяснимость), обнаружение дрейфа и шаблоны IAM/VPC для рабочих нагрузок ML. Проверяет практическую компетентность в MLOps больше, чем теорию.

Сервисы AWS в этом экзамене

Сервисы, с которыми вы столкнётесь на экзамене, и почему каждый из них важен.

Основные сервисы

Amazon SageMakerДокументация AWS ↗
Сквозная ML-платформа, охватывающая ноутбуки, обучающие задания, подбор гиперпараметров, задания обработки данных, управляемые конечные точки для инференса и MLOps-пайплайны.
Почему он на экзамене: SageMaker — зонтичный сервис, покрывающий все четыре домена MLA-C01: ожидайте вопросов о выборе инфраструктуры обучения, вариантах развёртывания инференса и компромиссах между управляемым и self-hosted-подходами.
Amazon SageMaker StudioДокументация AWS ↗
Веб-IDE для ML — Jupyter-ноутбуки, эксперименты, Pipelines, Model Registry, JumpStart и Canvas в едином рабочем пространстве.
Почему он на экзамене: Домен 2 (Разработка ML-моделей) проверяет Studio как унифицированную поверхность для итераций над моделями, отладки обучения и продвижения артефактов.
Amazon SageMaker JumpStartДокументация AWS ↗
Каталог предобученных базовых и задачеспецифичных моделей с развёртыванием в один клик, ноутбуками для transfer learning и сценариями дообучения.
Почему он на экзамене: JumpStart — канонический ответ, когда вопрос спрашивает, как стартовать с готовой модели вместо обучения с нуля, что актуально для Домена 2.
Amazon SageMaker ClarifyДокументация AWS ↗
Инструмент детекции смещений и интерпретируемости, который выдаёт SHAP-атрибуции признаков плюс метрики смещения до и после обучения для табличных и базовых моделей.
Почему он на экзамене: Вопросы Домена 2 и Домена 4 про ответственный ИИ, интерпретируемость моделей и аудит справедливости называют Clarify как нативное AWS-решение.
Amazon SageMaker Model MonitorДокументация AWS ↗
Непрерывно проверяет развёрнутые эндпоинты на дрейф качества данных, качества модели, смещений и атрибуций признаков относительно базовой линии.
Почему он на экзамене: Домен 4 (Мониторинг, обслуживание и безопасность) неоднократно проверяет, как обнаруживать и реагировать на дрейф в продакшене — Model Monitor назван прямо.
Amazon SageMaker Feature StoreДокументация AWS ↗
Управляемое хранилище ML-признаков с синхронизированными онлайн- (низколатентным) и офлайн- (батч) хранилищами, point-in-time-корректностью и переиспользованием признаков между моделями.
Почему он на экзамене: Домен 1 (Подготовка данных) проверяет Feature Store как канонический способ избежать training/serving skew и делиться признаками между командами.
Amazon SageMaker PipelinesДокументация AWS ↗
Нативный MLOps-оркестратор для SageMaker, связывающий предобработку, обучение, оценку, регистрацию моделей и условное развёртывание в виде версионированного DAG.
Почему он на экзамене: Домен 3 (Развёртывание и оркестрация) подчёркивает воспроизводимые сквозные пайплайны; для SageMaker-центричных стэков Pipelines — выбор AWS поверх универсальных оркестраторов.
Amazon SageMaker Data WranglerДокументация AWS ↗
Визуальный инструмент подготовки данных внутри Studio для импорта из S3, Athena, Redshift, Snowflake и применения 300+ встроенных трансформаций в один клик.
Почему он на экзамене: Вопросы Домена 1 по feature engineering и разведочному анализу данных часто называют Data Wrangler как low-code-ответ для подготовки табличных данных.

Специализированные сервисы

Amazon S3Документация AWS ↗
Объектное хранилище, играющее роль озера данных для обучающих наборов, артефактов моделей, входов/выходов инференса и офлайн-данных SageMaker Feature Store.
Почему он на экзамене: Каждый сценарий подготовки данных и развёртывания моделей в MLA-C01 предполагает S3 как основу хранения; классы хранения, lifecycle-политики и паттерны доступа всплывают в Доменах 1 и 4.
AWS GlueДокументация AWS ↗
Бессерверный ETL-сервис с управляемым Spark-рантаймом, Data Catalog, краулерами для обнаружения схем и Glue DataBrew для low-code-трансформаций.
Почему он на экзамене: Домен 1 называет Glue инструментом ETL/каталога данных по умолчанию для приведения сырых данных к форме, ожидаемой обучением в SageMaker.
Amazon AthenaДокументация AWS ↗
Бессерверный интерактивный SQL-движок поверх S3 (и федеративных источников), использующий Glue Data Catalog для схем и оплату за запрос.
Почему он на экзамене: Athena — ожидаемый ответ, когда вопрос спрашивает, как выполнять ad-hoc SQL-запросы к обучающим данным в S3 без поднятия кластера, что часто встречается в Домене 1.
Amazon EMRДокументация AWS ↗
Управляемая Hadoop/Spark-платформа для крупномасштабной обработки данных с поддержкой Spark MLlib, Hive, Presto и интеграции SageMaker Studio с EMR.
Почему он на экзамене: EMR встречается в сценариях Домена 1, выходящих за пределы масштаба Glue или требующих пайплайнов Spark MLlib вне SageMaker.
Amazon Kinesis Data StreamsДокументация AWS ↗
Сервис потоковой передачи данных в реальном времени для приёма clickstream, IoT- и логовых событий в большом объёме с возможностью повтора в пределах окна хранения.
Почему он на экзамене: Вопросы Домена 1 о потоковом приёме признаков (например, обнаружение мошенничества, свежесть рекомендаций) называют Kinesis как нативный AWS-ответ.
AWS LambdaДокументация AWS ↗
Бессерверные вычисления для event-driven-инференса, лёгкой предобработки, S3-триггеров и встраивания вызовов SageMaker в бизнес-процессы.
Почему он на экзамене: Сценарии развёртывания в Домене 3 различают компромиссы «хостинг на эндпоинте SageMaker» и «оборачивание в Lambda» — типичны вопросы о стоимости, cold start и размере полезной нагрузки.
Amazon ECRДокументация AWS ↗
Управляемый реестр контейнеров для Docker-образов, которые обучающие задания, задания обработки и эндпоинты инференса SageMaker подтягивают на этапе выполнения.
Почему он на экзамене: Домен 3 проверяет BYOC-сценарии для кастомного обучения и инференса — ECR назван хранилищем образов и реестром, интегрированным с IAM.
AWS Step FunctionsДокументация AWS ↗
Бессерверный оркестратор рабочих процессов с нативными интеграциями SageMaker для обучения, batch transform, развёртывания эндпоинтов и композиции шагов с Lambda.
Почему он на экзамене: Разделение Step Functions (мультисервисная оркестрация) и SageMaker Pipelines (нативный MLOps SageMaker) — повторяющийся паттерн дистракторов в Домене 3.

Безопасность и управление

AWS Identity and Access Management (IAM)Документация AWS ↗
Контроль доступа на уровне аккаунта: пользователи, роли, политики, федерация и least-privilege-разрешения для каждого действия SageMaker, S3 и пайплайнов.
Почему он на экзамене: Домен 4 (Безопасность) проверяет execution-роли IAM для обучения и инференса, межаккаунтное использование моделей и resource-based-политики на озере данных.
AWS Key Management Service (KMS)Документация AWS ↗
Управляемое создание и контроль криптографических ключей для шифрования обучающих данных, артефактов моделей, EBS-томов на обучающих инстансах и payload-ов эндпоинтов.
Почему он на экзамене: Шифрование данных в покое с использованием customer-managed-ключей — канонический ответ Домена 4 для защиты чувствительных обучающих корпусов и интеллектуальной собственности моделей.
Amazon CloudWatchДокументация AWS ↗
Метрики, логи и алармы для вызовов эндпоинтов SageMaker, прогресса обучающих заданий, кастомных метрик моделей и длительности шагов пайплайна.
Почему он на экзамене: Домен 4 ожидает CloudWatch для алармов по латентности и ошибкам эндпоинтов, разбора логов обучающих заданий и доставки находок Model Monitor ops-командам.
AWS CloudTrailДокументация AWS ↗
Аккаунт-уровневый журнал аудита всех вызовов API — кто запустил обучающее задание, кто обновил эндпоинт, кто скачал артефакты моделей из S3.
Почему он на экзамене: Сценарии комплаенса в Домене 4 называют CloudTrail неизменяемой записью, нужной чтобы ответить на вопросы «кто развернул эту модель» и «когда обращались к обучающим данным».

Влияние на карьеру

Типичные роли

Инженер по машинному обучению
MLOps-инженер
Инженер по AI/ML-платформам
Специалист по данным (с инженерным уклоном)
Архитектор решений AWS ML
Инженер по AI-приложениям
Консультант по облачным ML-решениям

Диапазон зарплат (США, приблизительно)

$120k–$165k–$230k USD годовая

Диапазон охватывает должности MLE среднего и высшего уровня в США, где требуется владение AWS. Старшие MLE в FAANG / компаниях-единорогах часто превышают $300 тыс. TC. Рынки начального уровня и не прибрежных регионов показывают более низкие показатели. Сам по себе сертификат не повышает зарплату — он дополняет портфолио внедренных ML-систем.

Источник: роли ML-инженеров levels.fyi 2025–2026, U.S. BLS OEWS May 2024 (15-2051 data scientists, 15-1252 software developers). Цифры приблизительны; фактическая компенсация зависит от роли, региона и опыта.

Рыночный спрос

Спрос на ML-инженеров, способных внедрять модели в производство — а не просто обучать их в ноутбуках — ускорился в 2024–2026 годах, поскольку предприятия начали операционализировать GenAI и классические ML-нагрузки. MLA-C01 служит надежным сигналом того, что кандидат понимает SageMaker от начала до конца и может управлять компромиссами MLOps. Рекрутеры в компаниях, ориентированных на AWS (финансовые услуги, здравоохранение, команды данных розничной торговли), используют его в качестве фильтра отбора наряду с опытом работы с Python и PyTorch/TensorFlow. Он естественным образом сочетается с AI Practitioner (AIF-C01) и Data Engineer Associate (DEA-C01) для более широкого профиля данных и ML. Сам по себе он НЕ квалифицирует кандидатов на роли в ML-исследованиях, должности специалистов по глубокому обучению или архитекторов ML-платформ — для них требуется многолетний опыт работы с внедренными системами, а часто и ученая степень.

Предварительные требования и рекомендуемый путь

Формальных предварительных требований нет. AWS рекомендует иметь не менее одного года практического опыта работы с SageMaker и ML-процессами, а также рабочие знания Python, распространенных ML-библиотек (scikit-learn, pandas, PyTorch или TensorFlow) и базовой статистики.

Наиболее эффективный путь — сначала сдать AIF-C01 (основополагающий словарь ИИ), затем создать небольшой сквозной проект SageMaker — хранилище признаков, задание на обучение, реестр моделей, конечную точку реального времени, мониторинг — прежде чем сдавать MLA-C01. Кандидатам с опытом Cloud Practitioner (CLF-C02) или Solutions Architect Associate (SAA-C03) вопросы по сервисам AWS даются гораздо легче. Чистое образование в области Data Science без опыта работы с AWS является самой сложной отправной точкой и обычно требует более 80 часов дополнительного изучения конкретных сервисов.

Насколько сложно и сколько времени на обучение

MLA-C01 имеет уровень Associate и значительно сложнее, чем AIF-C01, поскольку предполагает практическое владение SageMaker. Запланируйте 80–120 часов в течение 8–12 недель, если у вас есть предыдущий опыт ML, но ограниченный опыт работы с AWS; 40–60 часов в течение 4–6 недель, если вы ежедневно работаете с конвейерами AWS ML. Экзамен состоит из 65 вопросов, оцениваемых в течение 170 минут — множественный выбор и множественный ответ, без лабораторных работ.

Наиболее распространенным камнем преткновения является широкий спектр подсервисов SageMaker (Studio, Pipelines, Feature Store, Model Registry, Clarify, Model Monitor, JumpStart, Canvas, Autopilot, Ground Truth) — вопросы часто зависят от выбора правильного инструмента для ограниченного сценария. Вторая ловушка — режимы развертывания: точное знание того, когда использовать конечные точки реального времени, асинхронные, бессерверные или пакетные преобразования, а также компромиссы по стоимости и задержке для каждого из них.

История версий экзамена

MLA-C012024-08
Первоначальная общая доступность. Бета-экзамен проводился в середине 2024 года. Заменяет старую специализацию Machine Learning Specialty (MLS-C01) для кандидатов, ориентированных на инженерию. Актуальная версия по состоянию на апрель 2026 года.

Часто задаваемые вопросы

Насколько сложен экзамен MLA-C01?

MLA-C01 (AWS Certified Machine Learning Engineer Associate) — это Associate-уровневый экзамен, экзамен средней сложности, требующий практического опыта и глубокого понимания лучших практик. Большинству кандидатов требуется 80–150 часов обучения, распределенных на 6–12 недель, для экзаменов уровня Associate. Большинство кандидатов, которые стабильно набирают баллы выше проходного порога на пробных экзаменах, сдают его с первой попытки.

Сколько времени мне следует учиться для MLA-C01?

Большинству кандидатов требуется 80–150 часов обучения, распределенных на 6–12 недель, для экзаменов уровня Associate. Время, необходимое для сдачи, сильно варьируется в зависимости от предыдущего опыта. Инженерам с практическим опытом работы с базовой технологией обычно требуется меньше времени; кандидатам, новым для платформы, следует ориентироваться на верхнюю границу этого диапазона.

Стоит ли сертификация MLA-C01 того?

MLA-C01 — это признанная квалификация в экосистеме AWS, которая подтверждает знания для работодателей, рекрутеров и клиентов. Стоит ли это затраченного времени и платы, зависит от вашей роли и целей — это чаще всего окупается для облачных инженеров, архитекторов и консультантов, которые ежедневно работают с AWS или хотят перейти на такие должности.

Какой проходной балл для MLA-C01?

Проходной балл для MLA-C01 составляет 720 / 1000. Экзамен содержит 65 вопросов и длится 2 ч 50 мин.

Сколько стоит экзамен MLA-C01?

Стоимость экзамена MLA-C01 составляет $150 USD. Сборы устанавливаются AWS и могут варьироваться в зависимости от региона; всегда уточняйте текущую цену на официальной странице сертификации AWS перед бронированием.

Как долго действительна сертификация MLA-C01?

Сертификации AWS действительны в течение 3 лет. Пройдите повторную сертификацию, сдав текущую версию того же экзамена или сдав экзамен более высокого уровня в том же направлении до истечения срока действия.

Могу ли я сдать MLA-C01 онлайн?

Да. Вы можете сдать экзамен онлайн (с прокторингом через безопасный браузер провайдера, доступный 24/7 в большинстве регионов) или в очном центре тестирования Pearson VUE в рабочее время. Оба формата используют одни и те же вопросы, ограничение по времени и проходной балл.

Сколько вопросов в практическом экзамене MLA-C01 на CertLabPro?

CertLabPro предлагает 15 режимов обучения по банку практических вопросов для MLA-C01. Режим симуляции экзамена имитирует реальный экзамен: 65 вопросов за 2 ч 50 мин, с тем же проходным порогом 720 / 1000. Режим просмотра позволяет статически читать каждый вопрос и ответ.

Связанные учебные руководства

Связанные сертификации

AI-103

Microsoft Azure AI Apps and Agents Developer Associate

Associate

PMLE

Google Cloud Professional Machine Learning Engineer

Professional

DP-100

Microsoft Azure Data Scientist Associate

Associate

SAA-C03

AWS Certified Solutions Architect Associate

Associate

AWS

MLA-C01

AWS Certified Machine Learning Engineer Associate

275 практических вопросов

Последняя проверка: April 2026

Домены экзамена

Data Preparation for ML28%

ML Model Development26%

Deployment and Orchestration of ML Workflows22%

ML Solution Monitoring, Maintenance, and Security24%

ℹ️

Об экзамене

Регистрация, стоимость, проведение и правила

→

📝

Режим экзамена

65 случайных вопросов
Таймер на 170 минут
Результат в конце (проходной: 720/1000)
Имитирует реальный экзамен

📘

Справочник

Шаблоны «сценарий → решение»
Сгруппировано по разделам экзамена
Полностью бесплатно в вебе и в приложении
Чистый справочник — без вопросов и оценок

📚

Режим практики

Все 275 вопросов
Без ограничения по времени
Мгновенная обратная связь после каждого ответа
Учитесь в своём темпе

📑

Режим просмотра

Все 275 вопросов на одной странице
Ответы и объяснения видны
Быстрый обзор перед экзаменом
Прокрутите всё

🌿

Zen-режим

По одному вопросу
Свайп или стрелки
Возможность перемешивания
Расслабленное изучение карточек

⚡

Time Attack

Начните с 60 секунд
+10с за правильный ответ
-5с за неправильный ответ
Побейте свой рекорд

❤️

Выживание

Неограниченное время
Игра окончена при первой ошибке
Увеличивайте серию побед
Проверьте свою стабильность

⚩

Блиц-режим

15 секунд на вопрос
Бонус за быстрые ответы
Множитель серии (2x, 3x...)
Аркадный тест на скорость

🏃

Режим спринта

Секундомер (отсчёт вверх)
Ответьте правильно 10/25/50 подряд
Ошибка сбрасывает серию
Побейте свой лучший результат

🎓

Режим карточек

Только вопрос, без вариантов
Нажмите, чтобы показать ответ
Оцените: Знал / Частично / Не знал
Слабые вопросы появляются раньше

📚

Режим зубрёжки

Сначала непросмотренные вопросы
Затем вопросы, на которые вы ответили неправильно
Мгновенная обратная связь после каждого ответа
Отслеживайте общий охват

🔥

Испытание серии

Без давления по времени
Отслеживайте свою самую длинную серию
Ошибка сбрасывает до нуля
Побейте свой личный рекорд

💪

Слабое звено

Только вопросы, на которые вы ответили неправильно
Ответьте правильно 3 раза для освоения
Отслеживайте прогресс освоения
Устраните свои слабые места

📅

SRS-повторение

Ежедневное интервальное повторение
Вопросы запланированы с оптимальными интервалами
Оцените: Снова / Трудно / Хорошо / Легко
Наращивайте серию ежедневных повторений

🛠️

Лабораторная работа

Чистый Terraform / OpenTofu
Пояснения к каждому блоку кода
Копирование и вставка прямо в терминал
Связано с темами экзамена

📝

Заметки по учёбе

Личные заметки и ссылки на ресурсы для вашего учебного пути

📅

Календарь активности

Фильтр по сертификации

Обзор

Экзаменационные домены

Data Preparation for ML28%
Самая большая область, 28%. SageMaker Data Wrangler, Feature Store, Glue и шаблоны озер данных S3. Ожидайте вопросов по обработке несбалансированных данных, утечке данных, стратегиям кодирования и проектированию признаков в масштабе.
ML Model Development26%
Задания SageMaker для обучения, встроенные алгоритмы против собственного контейнера, JumpStart, настройка гиперпараметров и оценка модели. Распространенное затруднение: выбор между SageMaker Autopilot, Canvas и пользовательским обучением.
Deployment and Orchestration of ML Workflows22%
Конечные точки SageMaker (в реальном времени, асинхронные, бессерверные, пакетное преобразование), Pipelines, Model Registry и CI/CD с CodePipeline. Кандидаты часто упускают тонкие различия между режимами развертывания и их компромиссы по стоимости.
ML Solution Monitoring, Maintenance, and Security24%
SageMaker Model Monitor, Clarify (предвзятость и объяснимость), обнаружение дрейфа и шаблоны IAM/VPC для рабочих нагрузок ML. Проверяет практическую компетентность в MLOps больше, чем теорию.

Сервисы AWS в этом экзамене

Сервисы, с которыми вы столкнётесь на экзамене, и почему каждый из них важен.

Основные сервисы

Amazon SageMakerДокументация AWS ↗
Сквозная ML-платформа, охватывающая ноутбуки, обучающие задания, подбор гиперпараметров, задания обработки данных, управляемые конечные точки для инференса и MLOps-пайплайны.
Почему он на экзамене: SageMaker — зонтичный сервис, покрывающий все четыре домена MLA-C01: ожидайте вопросов о выборе инфраструктуры обучения, вариантах развёртывания инференса и компромиссах между управляемым и self-hosted-подходами.
Amazon SageMaker StudioДокументация AWS ↗
Веб-IDE для ML — Jupyter-ноутбуки, эксперименты, Pipelines, Model Registry, JumpStart и Canvas в едином рабочем пространстве.
Почему он на экзамене: Домен 2 (Разработка ML-моделей) проверяет Studio как унифицированную поверхность для итераций над моделями, отладки обучения и продвижения артефактов.
Amazon SageMaker JumpStartДокументация AWS ↗
Каталог предобученных базовых и задачеспецифичных моделей с развёртыванием в один клик, ноутбуками для transfer learning и сценариями дообучения.
Почему он на экзамене: JumpStart — канонический ответ, когда вопрос спрашивает, как стартовать с готовой модели вместо обучения с нуля, что актуально для Домена 2.
Amazon SageMaker ClarifyДокументация AWS ↗
Инструмент детекции смещений и интерпретируемости, который выдаёт SHAP-атрибуции признаков плюс метрики смещения до и после обучения для табличных и базовых моделей.
Почему он на экзамене: Вопросы Домена 2 и Домена 4 про ответственный ИИ, интерпретируемость моделей и аудит справедливости называют Clarify как нативное AWS-решение.
Amazon SageMaker Model MonitorДокументация AWS ↗
Непрерывно проверяет развёрнутые эндпоинты на дрейф качества данных, качества модели, смещений и атрибуций признаков относительно базовой линии.
Почему он на экзамене: Домен 4 (Мониторинг, обслуживание и безопасность) неоднократно проверяет, как обнаруживать и реагировать на дрейф в продакшене — Model Monitor назван прямо.
Amazon SageMaker Feature StoreДокументация AWS ↗
Управляемое хранилище ML-признаков с синхронизированными онлайн- (низколатентным) и офлайн- (батч) хранилищами, point-in-time-корректностью и переиспользованием признаков между моделями.
Почему он на экзамене: Домен 1 (Подготовка данных) проверяет Feature Store как канонический способ избежать training/serving skew и делиться признаками между командами.
Amazon SageMaker PipelinesДокументация AWS ↗
Нативный MLOps-оркестратор для SageMaker, связывающий предобработку, обучение, оценку, регистрацию моделей и условное развёртывание в виде версионированного DAG.
Почему он на экзамене: Домен 3 (Развёртывание и оркестрация) подчёркивает воспроизводимые сквозные пайплайны; для SageMaker-центричных стэков Pipelines — выбор AWS поверх универсальных оркестраторов.
Amazon SageMaker Data WranglerДокументация AWS ↗
Визуальный инструмент подготовки данных внутри Studio для импорта из S3, Athena, Redshift, Snowflake и применения 300+ встроенных трансформаций в один клик.
Почему он на экзамене: Вопросы Домена 1 по feature engineering и разведочному анализу данных часто называют Data Wrangler как low-code-ответ для подготовки табличных данных.

Специализированные сервисы

Amazon S3Документация AWS ↗
Объектное хранилище, играющее роль озера данных для обучающих наборов, артефактов моделей, входов/выходов инференса и офлайн-данных SageMaker Feature Store.
Почему он на экзамене: Каждый сценарий подготовки данных и развёртывания моделей в MLA-C01 предполагает S3 как основу хранения; классы хранения, lifecycle-политики и паттерны доступа всплывают в Доменах 1 и 4.
AWS GlueДокументация AWS ↗
Бессерверный ETL-сервис с управляемым Spark-рантаймом, Data Catalog, краулерами для обнаружения схем и Glue DataBrew для low-code-трансформаций.
Почему он на экзамене: Домен 1 называет Glue инструментом ETL/каталога данных по умолчанию для приведения сырых данных к форме, ожидаемой обучением в SageMaker.
Amazon AthenaДокументация AWS ↗
Бессерверный интерактивный SQL-движок поверх S3 (и федеративных источников), использующий Glue Data Catalog для схем и оплату за запрос.
Почему он на экзамене: Athena — ожидаемый ответ, когда вопрос спрашивает, как выполнять ad-hoc SQL-запросы к обучающим данным в S3 без поднятия кластера, что часто встречается в Домене 1.
Amazon EMRДокументация AWS ↗
Управляемая Hadoop/Spark-платформа для крупномасштабной обработки данных с поддержкой Spark MLlib, Hive, Presto и интеграции SageMaker Studio с EMR.
Почему он на экзамене: EMR встречается в сценариях Домена 1, выходящих за пределы масштаба Glue или требующих пайплайнов Spark MLlib вне SageMaker.
Amazon Kinesis Data StreamsДокументация AWS ↗
Сервис потоковой передачи данных в реальном времени для приёма clickstream, IoT- и логовых событий в большом объёме с возможностью повтора в пределах окна хранения.
Почему он на экзамене: Вопросы Домена 1 о потоковом приёме признаков (например, обнаружение мошенничества, свежесть рекомендаций) называют Kinesis как нативный AWS-ответ.
AWS LambdaДокументация AWS ↗
Бессерверные вычисления для event-driven-инференса, лёгкой предобработки, S3-триггеров и встраивания вызовов SageMaker в бизнес-процессы.
Почему он на экзамене: Сценарии развёртывания в Домене 3 различают компромиссы «хостинг на эндпоинте SageMaker» и «оборачивание в Lambda» — типичны вопросы о стоимости, cold start и размере полезной нагрузки.
Amazon ECRДокументация AWS ↗
Управляемый реестр контейнеров для Docker-образов, которые обучающие задания, задания обработки и эндпоинты инференса SageMaker подтягивают на этапе выполнения.
Почему он на экзамене: Домен 3 проверяет BYOC-сценарии для кастомного обучения и инференса — ECR назван хранилищем образов и реестром, интегрированным с IAM.
AWS Step FunctionsДокументация AWS ↗
Бессерверный оркестратор рабочих процессов с нативными интеграциями SageMaker для обучения, batch transform, развёртывания эндпоинтов и композиции шагов с Lambda.
Почему он на экзамене: Разделение Step Functions (мультисервисная оркестрация) и SageMaker Pipelines (нативный MLOps SageMaker) — повторяющийся паттерн дистракторов в Домене 3.

Безопасность и управление

AWS Identity and Access Management (IAM)Документация AWS ↗
Контроль доступа на уровне аккаунта: пользователи, роли, политики, федерация и least-privilege-разрешения для каждого действия SageMaker, S3 и пайплайнов.
Почему он на экзамене: Домен 4 (Безопасность) проверяет execution-роли IAM для обучения и инференса, межаккаунтное использование моделей и resource-based-политики на озере данных.
AWS Key Management Service (KMS)Документация AWS ↗
Управляемое создание и контроль криптографических ключей для шифрования обучающих данных, артефактов моделей, EBS-томов на обучающих инстансах и payload-ов эндпоинтов.
Почему он на экзамене: Шифрование данных в покое с использованием customer-managed-ключей — канонический ответ Домена 4 для защиты чувствительных обучающих корпусов и интеллектуальной собственности моделей.
Amazon CloudWatchДокументация AWS ↗
Метрики, логи и алармы для вызовов эндпоинтов SageMaker, прогресса обучающих заданий, кастомных метрик моделей и длительности шагов пайплайна.
Почему он на экзамене: Домен 4 ожидает CloudWatch для алармов по латентности и ошибкам эндпоинтов, разбора логов обучающих заданий и доставки находок Model Monitor ops-командам.
AWS CloudTrailДокументация AWS ↗
Аккаунт-уровневый журнал аудита всех вызовов API — кто запустил обучающее задание, кто обновил эндпоинт, кто скачал артефакты моделей из S3.
Почему он на экзамене: Сценарии комплаенса в Домене 4 называют CloudTrail неизменяемой записью, нужной чтобы ответить на вопросы «кто развернул эту модель» и «когда обращались к обучающим данным».

Влияние на карьеру

Типичные роли

Инженер по машинному обучению
MLOps-инженер
Инженер по AI/ML-платформам
Специалист по данным (с инженерным уклоном)
Архитектор решений AWS ML
Инженер по AI-приложениям
Консультант по облачным ML-решениям

Диапазон зарплат (США, приблизительно)

$120k–$165k–$230k USD годовая

Рыночный спрос

Предварительные требования и рекомендуемый путь

Насколько сложно и сколько времени на обучение

История версий экзамена

MLA-C012024-08
Первоначальная общая доступность. Бета-экзамен проводился в середине 2024 года. Заменяет старую специализацию Machine Learning Specialty (MLS-C01) для кандидатов, ориентированных на инженерию. Актуальная версия по состоянию на апрель 2026 года.