Microsoft Azure Data Scientist Associate
225 практических вопросов
Последняя проверка: April 2026
Личные заметки и ссылки на ресурсы для вашего учебного пути
Фильтр по сертификации
DP-100 подтверждает повседневные навыки специалиста по данным, работающего с Azure: разработка ML-решений, исследование и подготовка данных, обучение и развертывание моделей в Azure Machine Learning, а также — после обновления 2024 года — оптимизация языковых моделей для AI-приложений. Целевая аудитория — практикующие специалисты по данным и ML-инженеры, которые пишут код на Python для Azure ML SDK / CLI v2 и используют студию Azure ML. Экзамен в большей степени ориентирован на специфическую реализацию в Azure, нежели на классическую статистику или теорию алгоритмов: ожидайте 40–60 вопросов за 100 минут, включая задания типа "перетащить для завершения кода", сценарные задачи и как минимум одно тематическое исследование.
Около 22%. Выбор вычислительных ресурсов и хранилищ для ML-рабочих нагрузок, рабочие области Azure ML, хранилища данных и активы данных, среды, а также вопросы ответственного AI на этапе проектирования.
Около 22%. Записные книжки Azure ML, AutoML для классификации / регрессии / прогнозирования / NLP / CV, дизайнер Azure ML и базовая интеграция MLflow для отслеживания экспериментов.
Самый большой домен классического ML — 28%. Задания на обучение (сценарии и командные задания), распределенное обучение, задания на перебор гиперпараметров, регистрация моделей, управляемые онлайн-конечные точки, пакетные конечные точки и конвейеры.
Новый домен, добавленный в 2024 году, с весом 28%. Prompt flow, дообучение базовых моделей в Azure ML / Azure AI Foundry, оценка LLM-приложений, паттерны RAG и механизмы ответственного AI для генеративных сценариев.
Сервисы, с которыми вы столкнётесь на экзамене, и почему каждый из них важен.
Комплексная управляемая ML-платформа — рабочие области, вычисления, хранилища данных, среды, задания, реестры и управляемые конечные точки инференса на протяжении всего жизненного цикла.
Почему он на экзамене: Azure ML — это зонтичный сервис, охватывающий каждый домен DP-100; ожидайте вопросов о настройке рабочей области, выборе вычислительных ресурсов, версионировании активов и использовании CLI/SDK v2.
Веб-ориентированная рабочая область для Azure ML — ноутбуки, отслеживание экспериментов, браузеры активов, управление вычислениями и развёртывание моделей в один клик.
Почему он на экзамене: Домен 2 (Исследование данных и проведение экспериментов) проверяет Studio как интерфейс для запуска заданий, просмотра метрик выполнения и сравнения экспериментов.
Визуальный интерфейс drag-and-drop для создания, обучения и развёртывания ML-пайплайнов без написания кода, со встроенными модулями наборов данных и преобразований.
Почему он на экзамене: Домен 1 представляет Designer как путь low-code для подготовки данных и сборки обучающих пайплайнов — отличайте его от рабочих процессов SDK/CLI v2.
Автоматизированное обучение, которое перебирает алгоритмы, феатуризацию и гиперпараметры для задач классификации, регрессии, прогнозирования, NLP и компьютерного зрения.
Почему он на экзамене: Домен 3 (Обучение и развёртывание моделей) проверяет AutoML для базовых моделей, выбора моделей в масштабе и выявления лучшего выполнения для регистрации.
Версионированная многошаговая оркестрация для подготовки данных, обучения, оценки и развёртывания — объявляется через YAML-задания или Python SDK v2.
Почему он на экзамене: Сценарии воспроизводимости и повторного использования в Доменах 2 и 3 называют Pipelines каноническим ответом вместо ad-hoc скриптов или ноутбуков.
Реестр версионированных моделей в рамках рабочей области с этапами, тегами и подписанным происхождением до задания обучения и версии набора данных.
Почему он на экзамене: Сценарии продвижения в продакшн в Домене 3 проверяют Model Registry как аудируемую передачу между обучением и развёртыванием инференса.
Управляемые онлайн- (с низкой задержкой в реальном времени) и пакетные конечные точки для хостингового инференса, с разделением трафика, автомасштабированием и управляемым удостоверением.
Почему он на экзамене: Домен 3 часто задаёт вопросы о компромиссах между онлайн- и пакетным режимами и развёртываниях с разделением трафика blue/green — управляемые конечные точки являются названным примитивом.
Единая рабочая область для создания генеративных ИИ-приложений — каталог моделей, дообучение, потоки оценки, оркестрация промтов и интеграция безопасности контента.
Почему он на экзамене: Домен 4 (Оптимизация языковых моделей для ИИ-приложений) основан на AI Foundry как платформе для выбора базовых моделей, дообучения и оценки.
Управляемая платформа Apache Spark + Delta Lake с отслеживанием MLflow, распределённым обучением и тесной интеграцией с Azure ML для крупномасштабной подготовки данных и моделирования.
Почему он на экзамене: В сценариях работы с большими данными в Домене 1 предпочтение отдаётся Databricks для распределённого feature engineering и преобразований PySpark вне вычислительных ресурсов Azure ML.
Единая аналитическая платформа, объединяющая выделенные/бессерверные SQL-пулы, Spark-пулы и пайплайны для подготовки данных в масштабе хранилища, подаваемых в Azure ML.
Почему он на экзамене: Вопросы Домена 1 о корпоративных источниках данных для обучения называют Synapse коннектором источника на стороне хранилища для хранилищ данных Azure ML.
Уровень блочного хранилища с иерархическим пространством имён, оптимизированный для аналитических рабочих нагрузок — хранилище по умолчанию для хранилищ данных Azure ML и обучающих активов.
Почему он на экзамене: Каждый сценарий подготовки данных DP-100 предполагает ADLS Gen2 в качестве основы для данных — регистрация хранилища данных, ACL и политики жизненного цикла появляются в Домене 1.
Управляемый доступ к базовым моделям OpenAI (GPT-4o, GPT-4.1, o-series, моделям эмбеддинга) с дообучением, фильтрами контента и аутентификацией Entra ID.
Почему он на экзамене: Сценарии дообучения, эмбеддинга и prompt-engineering для приложений языковых моделей в Домене 4 основаны на Azure OpenAI Service.
Нативный сервер отслеживания MLflow внутри каждой рабочей области Azure ML — регистрируйте параметры, метрики, артефакты и модели с помощью открытого MLflow SDK.
Почему он на экзамене: Вопросы отслеживания экспериментов в Домене 2 называют MLflow каноническим API; ожидайте отвлекающие варианты, сравнивающие MLflow autolog с ручным захватом выходных данных задания.
Управляемые вычислительные кластеры (CPU/GPU), вычислительные инстансы и бессерверные опции обучения с автомасштабированием, ценообразованием с низким приоритетом и спотовыми уровнями.
Почему он на экзамене: Сценарии обучения в Домене 3 проверяют выбор CPU-vs-GPU, размер кластера для распределённого обучения и планирование квот для перебора гиперпараметров.
Визуальное и code-first создание рабочих процессов LLM — шаблоны промтов, цепочки вызовов инструментов, потоки оценки и пакетная оценка по тестовым наборам.
Почему он на экзамене: Сценарии RAG, prompt-engineering и оценки в Домене 4 тестируются через Prompt Flow как поверхность для создания production-grade решений.
Бессерверные event-driven вычисления для легковесного инференса в реальном времени, постобработки вывода модели и встраивания вызовов Azure ML в бизнес-процессы.
Почему он на экзамене: Вопросы о паттернах развёртывания в Домене 3 различают управляемые онлайн-конечные точки от кастомного инференса на базе Functions по причинам холодного старта, размера полезной нагрузки или стоимости.
Платформа идентификации, предоставляющая аутентификацию для пользователей/субъектов-служб, управляемые удостоверения, роли RBAC и условный доступ для каждого ресурса Azure ML.
Почему он на экзамене: Сценарии настройки рабочей области в Домене 1 и управления доступом к развёртыванию в Домене 3 называют управляемые удостоверения Entra ID нативным для AAD способом авторизации вычислений и конечных точек.
Управляемое хранилище секретов, ключей и сертификатов для строк подключения, ключей API моделей и управляемых клиентом ключей, защищающих обучающие данные и артефакты.
Почему он на экзамене: Шифрование данных рабочей области Azure ML с помощью управляемых клиентом ключей и получение секретов из обучающих заданий — оба сценария называют Key Vault ответом в Домене 1.
Метрики, логи, оповещения и покрытие Application Insights для конечных точек Azure ML, обучающих заданий и сигналов дрейфа данных через рабочие области Log Analytics.
Почему он на экзамене: Сценарии производственного мониторинга в Домене 3 проверяют Azure Monitor + Log Analytics для оповещений о задержках/ошибках конечных точек и вывода обнаружений дрейфа моделей для операционных команд.
Унифицированное управление данными для сканирования хранилищ данных, классификации конфиденциальных данных, отображения происхождения и применения политик доступа по всему аналитическому ландшафту.
Почему он на экзамене: Вопросы ответственного ИИ и управления данными в Доменах 1 и 4 ссылаются на Purview для происхождения обучающих данных, классификации PII и шлюзов выпуска моделей с учётом происхождения.
$115k–$165k–$230k USD годовая
Диапазон охватывает специалистов по данным среднего и высшего звена в США, для которых требуется знание Azure ML. Прикладные научные сотрудники FAANG / единорогов часто получают более $300 тыс. TC. Сертификат является сигналом для отбора; подтвержденный опыт моделирования и наличие публикаций / профиля на Kaggle / в open-source проектах определяют высокий уровень зарплаты.
Источник: данные levels.fyi за 2025 год для ролей специалиста по данным / ML-инженера, U.S. BLS OEWS май 2024 (15-2051 специалисты по данным, 15-2099 ML-специалисты), Glassdoor 2025. Цифры приблизительны; фактическая компенсация зависит от роли, региона и опыта.
DP-100 сохраняет стабильный спрос по мере того, как предприятия внедряют ML в Azure ML и все чаще в Azure AI Foundry. Рекрутеры рассматривают его как каноническое подтверждение владения Azure ML — наиболее полезное для специалистов по данным, которым необходимо продемонстрировать, что они могут развертывать решения за пределами записных книжек в управляемые конечные точки и конвейеры. Домен оптимизации LLM, добавленный в 2024 году, также сделал DP-100 более привлекательным для GenAI-инженеров. Он естественно сочетается с AI-102 для инженеров, создающих производственные GenAI-приложения, и с DP-203 / DP-700 для ML-специалистов с уклоном в инженерию данных.
Формальных требований нет, но DP-100 предполагает наличие навыков специалиста по данным на уровне практика. В плане Microsoft ожидается свободное владение Python, стеком scikit-learn / pandas / NumPy и основным рабочим процессом ML (разделение, обучение, оценка, развертывание). DP-900 является полезной концептуальной подготовкой для кандидатов, незнакомых с Azure data services, но не обязателен.
Официальный путь Microsoft Learn охватывает все четыре домена примерно за 30–40 часов, с акцентом на Azure ML SDK / CLI v2 и prompt flow. Практический опыт по сути обязателен: личная подписка Azure с небольшой рабочей областью Azure ML, плюс 10+ часов запуска реальных заданий на обучение, развертывания моделей и выполнения prompt-flow. Домен оптимизации LLM 2024 года недостаточно освещен в старых сторонних материалах, поэтому кандидатам следует полагаться на модули Microsoft Learn для этой области.
DP-100 относится к уровню Associate и обычно считается умеренно сложным — легче, чем AZ-204 / AI-102 для опытных специалистов по данным, но сложнее для инженеров, незнакомых с ML. Планируйте 60–100 часов обучения в течение 6–10 недель при наличии предыдущего опыта в области данных; значительно дольше, если Python ML для вас в новинку. Экзамен длится около 100 минут и включает 40–60 вопросов в форматах множественного выбора, множественного ответа, перетаскивания (включая завершение кода), горячих зон и тематических исследований.
Наиболее распространенной проблемой являются особенности Azure ML SDK / CLI v2 — недавний переход Microsoft с SDK v1 на v2 нарушил многие сторонние учебные пособия, поэтому старые материалы могут содержать устаревшие формы YAML и команд. Новый домен оптимизации LLM (prompt flow, дообучение, оценка) имеет свою собственную кривую обучения и склонен удивлять кандидатов, которые рассматривали DP-100 как экзамен по классическому ML.
Крупное обновление, добавившее домен оптимизации LLM (вес 28%), модернизировавшее материалы по заданиям на обучение и развертыванию до Azure ML SDK / CLI v2 и интегрировавшее концепции Azure AI Foundry. Microsoft обновляет DP-100 примерно каждые 12–18 месяцев без изменения кода экзамена.
Переход от фреймворка Azure ML SDK v1 к SDK / CLI v2, удаление вопросов, сильно зависящих от дизайнера Azure ML, и добавление охвата интеграции MLflow.
Первоначальный общий доступ (GA), заменивший устаревший DP-100 (старый код). Исходный план был сосредоточен на дизайнере Azure ML, AutoML и SDK v1.
DP-100 (Microsoft Azure Data Scientist Associate) — это Associate-уровневый экзамен, экзамен средней сложности, требующий практического опыта и глубокого понимания лучших практик. Большинству кандидатов требуется 80–150 часов обучения, распределенных на 6–12 недель, для экзаменов уровня Associate. Большинство кандидатов, которые стабильно набирают баллы выше проходного порога на пробных экзаменах, сдают его с первой попытки.
Большинству кандидатов требуется 80–150 часов обучения, распределенных на 6–12 недель, для экзаменов уровня Associate. Время, необходимое для сдачи, сильно варьируется в зависимости от предыдущего опыта. Инженерам с практическим опытом работы с базовой технологией обычно требуется меньше времени; кандидатам, новым для платформы, следует ориентироваться на верхнюю границу этого диапазона.
DP-100 — это признанная квалификация в экосистеме Azure, которая подтверждает знания для работодателей, рекрутеров и клиентов. Стоит ли это затраченного времени и платы, зависит от вашей роли и целей — это чаще всего окупается для облачных инженеров, архитекторов и консультантов, которые ежедневно работают с Azure или хотят перейти на такие должности.
Проходной балл для DP-100 составляет 700 / 1000. Экзамен содержит 50 вопросов и длится 1 ч 40 мин.
Стоимость экзамена DP-100 составляет $165 USD. Сборы устанавливаются Azure и могут варьироваться в зависимости от региона; всегда уточняйте текущую цену на официальной странице сертификации Azure перед бронированием.
Сертификации Microsoft, основанные на ролях, истекают через 1 год, но могут быть бесплатно продлены с помощью непроверяемого онлайн-оценки на Microsoft Learn, начиная за 6 месяцев до истечения срока действия.
Да. Вы можете сдать экзамен онлайн (с прокторингом через безопасный браузер провайдера, доступный 24/7 в большинстве регионов) или в очном центре тестирования Pearson VUE в рабочее время. Оба формата используют одни и те же вопросы, ограничение по времени и проходной балл.
CertLabPro предлагает 15 режимов обучения по банку практических вопросов для DP-100. Режим симуляции экзамена имитирует реальный экзамен: 50 вопросов за 1 ч 40 мин, с тем же проходным порогом 700 / 1000. Режим просмотра позволяет статически читать каждый вопрос и ответ.