Microsoft Azure Data Scientist Associate
225 שאלות תרגול
נבדק לאחרונה: April 2026
הערות אישיות וקישורים למשאבים למסע הלמידה שלך
סנן לפי הסמכה
DP-100 מאמת את המיומנויות היומיומיות של מדען נתונים העובד ב-Azure: תכנון פתרונות ML, חקירה והכנת נתונים, אימון ופריסת מודלים ב-Azure Machine Learning, ומאז הרענון של 2024 — אופטימיזציה של מודלי שפה עבור יישומי AI. קהל היעד הוא מדעני נתונים ומהנדסי ML בפועל, הכותבים Python מול Azure ML SDK / CLI v2 ומשתמשים ב-Azure ML studio. הבחינה מתמקדת יותר ביישום ספציפי ל-Azure מאשר בסטטיסטיקה קלאסית או תיאוריית אלגוריתמים: צפו ל-40–60 שאלות ב-100 דקות, כולל גרירה ושחרור של השלמת קוד, פריטי תרחיש ולפחות מקרה בוחן אחד.
כ-22%. בחירת משאבי מחשוב ואחסון עבור עומסי עבודה של ML, סביבות עבודה של Azure ML, מאגרי נתונים ונכסי נתונים, סביבות, ושיקולי AI אחראי בשלב התכנון.
כ-22%. מחברות Azure ML, AutoML לסיווג / רגרסיה / חיזוי / NLP / CV, Azure ML designer, ושילוב MLflow בסיסי למעקב אחר ניסויים.
התחום הגדול ביותר ב-ML קלאסי, עם 28%. משימות אימון (משימות סקריפט ופקודה), אימון מבוזר, משימות סריקת היפרפרמטרים, רישום מודלים, נקודות קצה מקוונות מנוהלות, נקודות קצה של אצווה (batch) וצינורות עיבוד נתונים (pipelines).
תחום חדש שנוסף ב-2024 במשקל של 28%. Prompt flow, כוונון עדין של מודלי בסיס ב-Azure ML / Azure AI Foundry, הערכת יישומי LLM, דפוסי RAG, ובקרות AI אחראי עבור תרחישים יצירתיים (generative scenarios).
שירותים שתפגוש במבחן ומדוע כל אחד מהם חשוב.
פלטפורמת ML מנוהלת מקצה-לקצה — workspaces, compute, datastores, environments, jobs, registries, ונקודות קצה מנוהלות ל-inference לאורך מחזור החיים המלא.
מדוע הוא במבחן: Azure ML הוא שירות המטרייה החוצה את כל דומייני DP-100 — צפו לשאלות על הגדרת workspace, בחירת compute, ניהול גרסאות נכסים ושימוש ב-CLI/SDK v2.
Workspace מבוסס-אינטרנט עבור Azure ML — notebooks, מעקב אחר ניסויים, דפדפני נכסים, ניהול compute ופריסת מודלים בלחיצה אחת.
מדוע הוא במבחן: דומיין 2 (Explore data and run experiments) בוחן את Studio כממשק להפעלת jobs, צפייה במדדי הרצה והשוואת ניסויים זה לצד זה.
ממשק ויזואלי של גרירה ושחרור לבנייה, אימון ופריסה של ML pipelines ללא כתיבת קוד, עם מודולי dataset ו-transform מובנים.
מדוע הוא במבחן: דומיין 1 מציג את Designer כנתיב ה-low-code להכנת נתונים והרכבת training pipelines — הבחינו בינו לבין workflows מבוססי SDK/CLI v2.
אימון אוטומטי הסורק אלגוריתמים, featurization והיפר-פרמטרים על פני משימות classification, regression, forecasting, NLP ו-vision.
מדוע הוא במבחן: דומיין 3 (Train and deploy models) בוחן את AutoML עבור מודלי baseline, בחירת מודלים בקנה מידה גדול והצגת ההרצה הטובה ביותר לרישום.
תזמור רב-שלבי עם גרסאות להכנת נתונים, אימון, הערכה ופריסה — מוצהר באמצעות YAML jobs או Python SDK v2.
מדוע הוא במבחן: תרחישי שחזור ושימוש חוזר בדומיינים 2 ו-3 מציינים את Pipelines כתשובה הקנונית על פני סקריפטים אד-הוק או notebooks.
registry בעל טווח workspace של מודלים עם גרסאות, עם stages, tags ו-lineage חתום חזרה ל-training job ולגרסת ה-dataset.
מדוע הוא במבחן: תרחישי קידום לייצור בדומיין 3 בוחנים את Model Registry כמסירה ניתנת לביקורת בין אימון ופריסת inference.
נקודות קצה מנוהלות מקוונות (זמן אמת בהשהיה נמוכה) ו-batch עבור inference מתארח, עם פיצול תעבורה, autoscaling ו-managed identity.
מדוע הוא במבחן: דומיין 3 שואל לעתים קרובות על טרייד-אופים בין online ל-batch ופריסות blue/green עם פיצול תעבורה — נקודות קצה מנוהלות הן הפרימיטיב הנקוב.
Workspace מאוחד לבניית אפליקציות generative-AI — קטלוג מודלים, fine-tuning, זרימות הערכה, תזמור prompt ושילוב content-safety.
מדוע הוא במבחן: דומיין 4 (Optimize language models for AI applications) מעוגן ב-AI Foundry כפלטפורמה לבחירת foundation-model, fine-tuning והערכה.
פלטפורמת Apache Spark + Delta Lake מנוהלת עם מעקב MLflow, אימון מבוזר ושילוב הדוק עם Azure ML להכנת נתונים ומידול בקנה מידה גדול.
מדוע הוא במבחן: תרחישי נתונים גדולים בדומיין 1 מעדיפים את Databricks עבור distributed feature engineering ו-PySpark transforms מחוץ ל-Azure ML compute.
פלטפורמת אנליטיקה מאוחדת המשלבת SQL pools ייעודיים/serverless, Spark pools ו-pipelines להכנת נתונים בקנה מידה של warehouse המזינים את Azure ML.
מדוע הוא במבחן: שאלות בדומיין 1 על מקורות נתונים ארגוניים לאימון מציינות את Synapse כמחבר המקור בצד ה-warehouse עבור Azure ML datastores.
שכבת אחסון blob עם namespace היררכי המותאמת לעומסי עבודה של אנליטיקה — אחסון הגיבוי המוגדר כברירת מחדל עבור Azure ML datastores ונכסי אימון.
מדוע הוא במבחן: כל תרחיש הכנת נתונים ב-DP-100 מניח את ADLS Gen2 כ-data substrate — רישום datastore, ACLs ומדיניות lifecycle כולם מופיעים בדומיין 1.
גישה מנוהלת למודלי foundation של OpenAI (GPT-4o, GPT-4.1, o-series, embedding models) עם fine-tuning, מסנני תוכן ואימות Entra-ID.
מדוע הוא במבחן: תרחישי fine-tuning, embedding ו-prompt-engineering בדומיין 4 עבור אפליקציות language-model מעוגנים ב-Azure OpenAI Service.
שרת MLflow tracking ילידי בתוך כל Azure ML workspace — מתעד params, metrics, artifacts ומודלים באמצעות MLflow SDK הפתוח.
מדוע הוא במבחן: שאלות מעקב ניסויים בדומיין 2 מציינות את MLflow כ-API הקנוני; צפו ל-distractors המשווים MLflow autolog ללכידת job-output ידנית.
compute clusters מנוהלים (CPU/GPU), compute instances ואפשרויות אימון serverless עם autoscaling, תמחור low-priority ו-spot tiers.
מדוע הוא במבחן: תרחישי אימון בדומיין 3 בוחנים בחירה בין CPU ל-GPU, קביעת גודל cluster לאימון מבוזר ותכנון מכסות עבור hyperparameter sweeps.
יצירה ויזואלית + code-first של LLM workflows — prompt templates, קריאות tool משורשרות, זרימות הערכה ו-batch-run grading מול test sets.
מדוע הוא במבחן: תרחישי RAG, prompt-engineering והערכה בדומיין 4 נבחנים באמצעות Prompt Flow כממשק היצירה ברמת הייצור.
compute serverless מונחה-אירועים עבור inference קל משקל בזמן אמת, post-processing של פלט מודל, ושילוב קריאות Azure ML ב-workflows עסקיים.
מדוע הוא במבחן: שאלות דפוסי פריסה בדומיין 3 מבחינות בין נקודות קצה מקוונות מנוהלות לבין inference מותאם אישית מבוסס Functions מסיבות cold-start, גודל payload או עלות.
פלטפורמת זהויות המספקת אימות user/service-principal, managed identities, RBAC roles ו-Conditional Access עבור כל משאב Azure ML.
מדוע הוא במבחן: תרחישי הגדרת workspace בדומיין 1 ותרחישי בקרת גישה לפריסה בדומיין 3 מציינים את Entra ID managed identities כדרך ה-AAD-native לאשר compute ונקודות קצה.
מאגר מנוהל של secrets, keys ו-certificates עבור connection strings, model API keys ו-customer-managed keys המגנים על training data ו-artifacts.
מדוע הוא במבחן: הצפנת customer-managed key עבור נתוני Azure ML workspace ו-secret retrieval מ-training jobs מציינים שניהם את Key Vault כתשובה בדומיין 1.
מדדים, לוגים, התראות וכיסוי Application Insights עבור Azure ML endpoints, training jobs ו-data drift signals באמצעות Log Analytics workspaces.
מדוע הוא במבחן: תרחישי ניטור ייצור בדומיין 3 בוחנים את Azure Monitor + Log Analytics עבור התראות latency/error של נקודות קצה והצגת זיהוי model-drift לצוותי ops.
ממשל נתונים מאוחד לסריקת datastores, סיווג נתונים רגישים, מיפוי lineage ואכיפת access policies על פני נכסי האנליטיקה.
מדוע הוא במבחן: שאלות Responsible-AI ו-data-governance בדומיינים 1 ו-4 מפנות ל-Purview עבור training-data lineage, PII classification ו-lineage-aware model release gates.
$115k–$165k–$230k USD שנתי
הטווח מכסה מדעני נתונים בארה"ב ברמת ביניים עד בכירה שבהם נדרשת מיומנות ב-Azure ML. מדענים יישומיים ב-FAANG / חברות יוניקורן מגיעים לעיתים קרובות ל-300 אלף דולר בסך הפיצויים (TC). ההסמכה היא סימן סינון; ניסיון מוכח במודלים ונוכחות בפרסומים / kaggle / קוד פתוח מניעים את הקצה העליון.
מקור: תפקידי מדען נתונים / מהנדס ML ב-levels.fyi 2025, נתוני U.S. BLS OEWS מאי 2024 (15-2051 מדעני נתונים, 15-2099 מדעני ML), Glassdoor 2025. הנתונים משוערים; התגמול בפועל תלוי בתפקיד, באזור ובניסיון.
ל-DP-100 יש ביקוש יציב מאז שארגונים מתחילים להפעיל ML ב-Azure ML ובהדרגה גם ב-Azure AI Foundry. מגייסים מתייחסים אליו כהוכחה קאנונית למיומנות ב-Azure ML — שימושי במיוחד עבור מדעני נתונים שצריכים להוכיח שהם יכולים לעבור מעבר למחברת (notebook) לנקודות קצה מנוהלות וצינורות עיבוד נתונים (pipelines). תחום אופטימיזציית LLM של 2024 הפך את DP-100 לאטרקטיבי יותר גם עבור מהנדסי GenAI. הוא משתלב באופן טבעי עם AI-102 עבור מהנדסים הבונים אפליקציות GenAI בסביבת ייצור ועם DP-203 / DP-700 עבור מתרגלי ML בעלי נטייה להנדסת נתונים.
אין דרישות קדם רשמיות, אך DP-100 מניח מיומנויות מדע נתונים ברמת מתרגל. המתאר של מיקרוסופט מצפה לשליטה ב-Python, בערימת scikit-learn / pandas / NumPy, ובתהליך העבודה הליבתי של ML (פיצול, אימון, הערכה, פריסה). DP-900 הוא מסלול כניסה רעיוני שימושי עבור מועמדים חדשים לשירותי נתונים של Azure, אך אינו נדרש.
המסלול הרשמי של Microsoft Learn מכסה את כל ארבעת התחומים בכ-30–40 שעות, ומתמקד ב-Azure ML SDK / CLI v2 וב-prompt flow. זמן התנסות מעשית נדרש באופן מהותי: מינוי Azure אישי עם סביבת עבודה קטנה של Azure ML, בתוספת 10+ שעות של הפעלת משימות אימון אמיתיות, פריסות מודלים והרצות של prompt-flow. תחום אופטימיזציית LLM של 2024 אינו מכוסה מספיק בחומרים ישנים יותר של צד שלישי, ולכן מועמדים צריכים להסתמך על מודולי Microsoft Learn עבור תחום זה.
DP-100 נמצא ברמת ה-Associate ונחשב בדרך כלל לבינוני בקושיו — קל יותר מ-AZ-204 / AI-102 עבור מדעני נתונים מנוסים, קשה יותר עבור מהנדסים חדשים ל-ML. תכננו 60–100 שעות לימוד לאורך 6–10 שבועות עם ניסיון קודם במדע נתונים; זמן ארוך משמעותית אם Python ML חדש לכם. הבחינה אורכת כ-100 דקות עם 40–60 שאלות בפורמטים של בחירה מרובה, תגובה מרובה, גרירה ושחרור (כולל השלמת קוד), אזור חם, ומקרה בוחן.
אבן הנגף הנפוצה ביותר היא הפרטים הספציפיים של Azure ML SDK / CLI v2 — ההגירה האחרונה של מיקרוסופט מ-SDK v1 ל-v2 שברה מדריכי לימוד רבים של צד שלישי, כך שחומרים ישנים יותר עשויים להציג קובצי YAML וצורות פקודה מיושנות. לתחום אופטימיזציית LLM החדש (prompt flow, כוונון עדין, הערכה) יש עקומת למידה משלו ונוטה להפתיע מועמדים שהתייחסו ל-DP-100 כבחינת ML קלאסית.
רענון גדול שהוסיף את תחום אופטימיזציית LLM (במשקל 28%), עדכן את חומרי משימות האימון והפריסה ל-Azure ML SDK / CLI v2, ושילב מושגי Azure AI Foundry. מיקרוסופט מרעננת את DP-100 בערך כל 12–18 חודשים ללא שינוי קוד הבחינה.
היגר ממסגרת Azure ML SDK v1 למסגרת SDK / CLI v2, הפסיק שאלות המתמקדות ב-Azure ML designer, והוסיף כיסוי לשילוב MLflow.
זמינות כללית (GA) ראשונית, שהחליפה את DP-100 הפרוש (קוד מדור קודם). המתאר המקורי התמקד ב-Azure ML designer, AutoML ו-SDK v1.
DP-100 (Microsoft Azure Data Scientist Associate) הוא מבחן ברמת Associate מבחן קשה במידה, המצפה לניסיון מעשי בתוספת הבנה מוצקה של שיטות עבודה מומלצות. רוב המועמדים זקוקים ל-80–150 שעות לימוד הפרוסות על פני 6–12 שבועות עבור מבחני רמת Associate. רוב המועמדים שמקבלים ציונים באופן עקבי מעל סף המעבר במבחני תרגול עוברים בניסיון הראשון.
רוב המועמדים זקוקים ל-80–150 שעות לימוד הפרוסות על פני 6–12 שבועות עבור מבחני רמת Associate. משך הזמן למעבר משתנה מאוד בהתאם לניסיון קודם. מהנדסים בעלי ניסיון מעשי בסביבת ייצור בטכנולוגיה הבסיסית זקוקים בדרך כלל לפחות זמן; מועמדים חדשים לפלטפורמה צריכים לתכנן את לימודיהם לכיוון הקצה העליון של טווח זה.
DP-100 הוא אישור מוכר במערכת האקולוגית של Azure ומסמן ידע מאומת למעסיקים, מגייסים ולקוחות. האם זה שווה את הזמן והעמלה עבורך תלוי בתפקיד ובמטרות שלך – זה נוטה להשתלם ביותר עבור מהנדסי ענן, אדריכלים ויועצים שעובדים עם Azure על בסיס יומיומי או רוצים לעבור לתפקידים כאלה.
ציון המעבר עבור DP-100 הוא 700 / 1000. המבחן מכיל 50 שאלות ונמשך 1 שע' 40 דק'.
עמלת מבחן ה-DP-100 היא $165 USD. העמלות נקבעות על ידי Azure ועשויות להשתנות לפי אזור; תמיד אשרו את המחיר הנוכחי בדף ההסמכה הרשמי של Azure לפני ההזמנה.
הסמכות מבוססות תפקיד של Microsoft פגות תוקף לאחר שנה אך ניתן לחדשן בחינם באמצעות הערכה מקוונת ללא פיקוח ב-Microsoft Learn, החל מ-6 חודשים לפני התפוגה.
כן. ניתן לגשת למבחן באופן מקוון (בפיקוח דרך הדפדפן המאובטח של הספק, זמין 24/7 ברוב האזורים) או במרכז בחינה פיזי של Pearson VUE בשעות הפעילות. שני הפורמטים משתמשים באותן שאלות, מגבלת זמן וציון מעבר.
CertLabPro מספק 15 מצבי לימוד על פני בנק השאלות לתרגול עבור DP-100. מצב סימולציית המבחן משקף את המבחן האמיתי: 50 שאלות ב-1 שע' 40 דק', עם אותו סף מעבר של 700 / 1000. מצב עיון מאפשר לך לקרוא כל שאלה ותשובה באופן סטטי.