手册 — AI-901 Microsoft Azure AI Fundamentals

最后审核：2026年6月

AI-901 考试涉及的架构模式快速参考。从头到尾阅读，或跳转到任意章节。

识别 AI 概念和能力

贷款审批模型不得基于性别或种族歧视申请人。

应用负责任 AI 的公平性原则：评估并缓解不同人口群体间的偏见。

原因: 公平性旨在实现公平对待；不要将其与可靠性（一致结果）或隐私（数据保护）混淆。

参考

自动驾驶模型必须在意外情况下保持一致行为并安全地失效。

应用可靠性和安全性：针对边缘情况进行严格测试、监控和设置防护措施。

原因: 可靠性和安全性是指在不确定性下保持一致且避免伤害的行为，而不是关于数据涉及的对象。

健康应用处理个人数据，必须保护其免遭泄露或滥用。

应用隐私和安全性：保护个人数据，控制访问，并尊重同意。

原因: 此原则涵盖数据保密性和保护；公平性和包容性则关乎系统服务于谁。

解决方案应赋能并吸引所有人，无论其能力或背景如何。

应用包容性：设计时应使所有人受益，包括残障人士。

原因: 包容性关乎广泛的可访问性和覆盖范围；公平性则特指无偏见的结果。

用户必须了解 AI 系统如何做出决策及其局限性。

应用透明度：解释系统的工作原理、目的、功能和局限性。

原因: 透明度使系统易于理解；问责制则关乎谁应对其负责。

需要明确的所有权和治理，以便有人对 AI 系统的行为负责。

应用问责制：人们在治理框架内设计、构建和操作，并承担责任。

原因: 问责制明确了人类的责任；透明度只解释系统，不赋予所有权。

解释生成式 AI 模型如何根据 prompt 生成连贯的段落。

大型语言模型利用从海量训练文本中学习到的模式，重复预测下一个 token。

原因: Generative models 通过概率 token 预测生成新内容；它们不会逐字检索存储的答案。

参考

选择模型：一个需要经济高效且处理大量聊天的模型，另一个则需要复杂的多步骤推理能力。

根据任务匹配模型 — 较小/更快的模型用于常规聊天，较大的推理模型用于复杂任务。

原因: 越大并非总是越好；能力、成本和延迟需要权衡，因此应根据工作负载需求进行选择。

参考

决定如何使用模型：托管标准 endpoint vs. 专用容量。

对于可变负载，使用标准（按使用量付费）部署；对于稳定大容量、可预测的性能，则使用预置吞吐量。

原因: 预置容量可确保一致的延迟；标准部署按 token 计费，并且最容易上手。

参考

输出过于重复；您需要更有创意、更多样化的响应。

提高 temperature 参数；将其降低到接近 0 可获得确定性、专注的输出。

原因: Temperature 控制 token 选择的随机性；高 = 有创意，低 = 一致。

响应在句中被截断，或者您需要限制输出长度和成本。

调整 max tokens（最大完成长度）参数以设置响应上限。

原因: Max tokens 限制输出长度；它不会改变创造力 — 那是 temperature 或 top-p 的作用。

您希望将 token 选择限制在最可能的一组，而无需严格的 temperature 控制。

使用 top-p (nucleus sampling) 将采样限制在概率之和为 p 的最小 token 集合。

原因: Top-p 通过概率质量缩小候选池；调整它或 temperature，通常不要同时积极调整两者。

工作负载必须根据 prompt 起草营销文案和摘要。

这是一个 generative AI 工作负载 — 从自然语言指令创建内容。

原因: Generative workloads 产生新内容；文本分析仅从现有文本中提取见解。

系统必须在最少监督下规划步骤、调用工具并朝着目标行动。

这是一个 agentic AI 工作负载 — 由 LLM 驱动的 agent，能够推理、使用工具并采取行动。

原因: Agentic 在生成的基础上增加了自主性和工具使用；纯粹的 generative AI 仅返回内容。

工作负载从客户评论中挖掘 sentiment、key phrases 和 named entities。

这是一个文本分析 (NLP) 工作负载。

原因: 文本分析解释现有文本；它不像 generative workload 那样生成新散文。

参考

工作负载必须转录通话内容并朗读响应。

这是一个 speech 工作负载 — speech-to-text recognition 和 text-to-speech synthesis。

原因: Speech 涵盖音频输入/输出；computer vision 处理图像，而非音频。

工作负载必须检测物体并从照片中读取文本。

这是一个 computer vision 工作负载 — 图像分类、物体检测和 OCR。

原因: Computer vision 解释图像；从文档中提取信息是相关但不同的任务。

工作负载必须从扫描发票中提取日期、总计和供应商等字段。

这是一个信息/数据提取工作负载（document understanding）。

原因: 提取从文档中拉取结构化字段；通用 OCR 仅返回原始文本，而非带标签的字段。

您需要从一段文本中获取主要主题，而无需全部阅读。

使用 key phrase (keyword) extraction 来呈现最重要的术语。

原因: Key phrase extraction 列出显著术语；entity detection 则分类命名实体，如人或地点。

您必须识别文本中提及的人物、组织、地点和日期。

使用 named entity recognition (entity detection) 对这些实体进行分类。

原因: Entity detection 标记命名实体；sentiment analysis 则评估情感语调。

您想知道评论是正面的、负面的还是中性的。

使用 sentiment analysis 来评估文本中表达的观点。

原因: Sentiment 衡量语调；summarization 浓缩内容，它不判断极性。

您需要一份长报告的简短摘要。

使用 text summarization（extractive 或 abstractive）来浓缩文档。

原因: Summarization 在保留意义的同时缩短内容；key phrase extraction 仅列出术语，而非可读的摘要。

区分将音频转换为文本和将文本转换为音频。

Speech recognition (speech-to-text) 转录音频；speech synthesis (text-to-speech) 生成语音音频。

原因: Recognition 是输入音频→文本；synthesis 则相反 — 不要混淆这两个方向。

参考

使用 Microsoft Foundry 实施 AI 解决方案

您需要一个单一平台来发现模型、部署模型并在 Azure 上构建 AI 应用。

使用 Microsoft Foundry portal — 它托管模型目录、部署、playground 和 agent 工具。

原因: Foundry 是统一的中心；虽然存在独立的 Azure AI 服务，但 Foundry 是您编写和部署解决方案的地方。

参考

您希望模型始终以礼貌的客服 agent 身份回答，无论提出的问题是什么。

在 system prompt 中设置行为和 persona；将具体问题放入 user prompt。

原因: system prompt 设定整体行为和规则；user prompt 是每一轮的请求。

参考

您在目录中选择了一个模型，需要使其可从应用中调用。

在 Foundry portal 中为模型创建部署，这将提供一个 endpoint 和密钥。

原因: 目录中的模型在部署之前无法使用；部署会公开可调用的 endpoint。

参考

您想在编写任何代码之前测试 prompt 并调整 temperature。

使用 Foundry portal 中的 chat playground 与部署的模型交互并调整参数。

原因: playground 允许您交互式地迭代 prompt 和设置；无需 SDK 即可进行实验。

您需要从应用程序代码中调用已部署的聊天模型。

使用 Foundry (Azure AI) SDK 创建一个聊天客户端，向部署 endpoint 发送消息。

原因: SDK 使用类型化客户端封装 endpoint；您传递 system 和 user 消息并读取完成内容。

参考

您的应用必须对部署的模型进行身份验证。

使用部署的 endpoint URL 和 API 密钥或 Microsoft Entra ID (Azure AD) 凭据。

原因: 基于密钥的身份验证最简单；Entra ID 更安全，并避免在代码中嵌入秘密。

您想要一个遵循指令并使用工具的 AI 助手，且无需大量代码即可构建。

在 Foundry portal 中创建单个 agent — 定义其指令、模型和工具（Agent Service）。

原因: portal agent builder 声明性地配置行为和工具；您无需手动编写编排循环。

参考

您的 agent 应始终引用来源并拒绝离题请求。

将这些规则编码到 agent 的指令中（其系统级指导）。

原因: Agent 指令在不同轮次中引导一致行为，类似于普通聊天模型的 system prompt。

您的 agent 必须从公司文档而非仅其训练数据中获取答案。

为 agent 提供知识/grounding 工具（例如，文件搜索或 Azure AI Search），以便它检索您的数据。

原因: Grounding/RAG 提供当前、私有的上下文；没有它，模型可能会产生幻觉或使用过时知识。

您需要一个自定义应用来编程驱动 Foundry agent。

使用 Foundry SDK 构建 agent 客户端应用 — 创建一个 thread，添加消息，运行 agent，读取响应。

原因: SDK 暴露 threads、runs 和 messages，因此您的应用可以将 agent 集成到任何工作流中。

参考

您必须构建一个从传入文本中提取 sentiment 和 entities 的应用。

通过 Foundry 访问，使用 SDK 或 REST 调用 Azure AI Language (text analysis) 的 sentiment 和 NER 功能。

原因: 对于经典 NLP 任务，Language 服务是专门构建的，并且比 prompt 通用 LLM 更经济。

参考

用户想要说出问题，并让已部署的模型回答。

将音频发送到接受语音输入的 multimodal 模型，或者先转录，然后 prompt 模型。

原因: Multimodal 模型可以直接接收音频；否则，使用 speech-to-text 来喂给文本模型。

您的应用需要高质量的转录和自然的语音输出。

在 Foundry Tools 中使用 Azure AI Speech 进行 speech-to-text 和 text-to-speech。

原因: Speech 服务提供经过优化的识别和逼真的 neural voices，超越了单独的聊天模型所能提供的功能。

参考

您需要应用以自然的声音朗读响应。

使用 Azure AI Speech 的 text-to-speech 和 neural voice；如果需要，使用 SSML 控制韵律。

原因: Neural voices 听起来自然；SSML 允许您调整语速、音高和发音。

应用必须描述用户提供的照片中发生的事情并回答相关问题。

将图像发送到 Foundry 中的 multimodal 模型，并使用问题对其进行 prompt。

原因: Multimodal LLM 对图像内容进行推理；经典的 Vision 服务仅返回固定标签和标题。

参考

应用必须按需从文本描述生成图像。

在 Foundry 中部署一个 text-to-image 模型（例如，DALL-E / image generation 模型），并从您的应用中调用它。

原因: Image generation 模型从 prompt 创建视觉内容；vision 模型仅分析现有图像。

参考

您需要一个能够分类图像并从中读取印刷文本的应用。

通过 Foundry 访问，使用 Azure AI Vision（图像分析和 OCR）构建 vision 应用。

原因: Azure AI Vision 提供现成的图像分析和 OCR；您无需为常见任务训练模型。

参考

应用必须从扫描页面中提取印刷体和手写文本。

使用 Azure AI Vision 的 OCR (Read) 功能来返回识别的文本及其位置。

原因: OCR 返回带坐标的原始文本；结构化字段提取需要 Content Understanding。

您必须从发票和表格中提取结构化字段（总计、日期、明细）。

在 Foundry Tools 中使用 Azure AI Content Understanding 从文档和表格中提取结构化数据。

原因: Content Understanding 提取带标签的字段；普通的 OCR 只返回非结构化文本。

参考

您需要从一批图像中提取结构化描述和 metadata。

使用 Azure AI Content Understanding 分析图像并返回结构化输出。

原因: Content Understanding 针对不同内容类型生成一致的结构化结果，超越了自由文本标题。

您必须将通话录音转换为包含关键数据点的结构化摘要。

对音频使用 Azure AI Content Understanding 进行转录和提取结构化字段。

原因: Content Understanding 将转录与提取相结合；单独的 Speech 只提供转录文本。

您需要从训练视频中提取场景、主题和关键字段。

使用 Azure AI Content Understanding for video 来跨模态提取结构化见解。

原因: 它同时分析音频和视觉流以生成结构化输出，而不仅仅是转录文本。

参考

您必须以最小的代价将您公司的私有 FAQ 知识添加到模型答案中。

通过对您的文档进行检索 (RAG) 来 grounding 模型，而不是 fine-tuning。

原因: RAG 在查询时注入当前数据，更简单/更便宜；fine-tuning 改变行为，而非知识的新鲜度。

您必须阻止已部署模型输出有害或不安全的文本和图像。

在部署上启用 Azure AI Content Safety 过滤器，以检测和阻止有害内容。

原因: Content Safety 在运行时强制执行负责任 AI 的防护措施；仅基础模型无法保证安全。

参考

部署后，您需要衡量响应质量并监控漂移。

使用 Foundry evaluation 和 monitoring 工具来评估输出并跟踪随时间变化的指标。

原因: Evaluation 量化质量（groundedness、相关性）；monitoring 捕获生产中的回归。

您需要为单个应用程序组织模型、agent 和连接。

创建一个 Foundry project，它将该解决方案的部署、连接资源和工具分组。

原因: 一个 project 是工作区边界；connections 连接外部资源，如 Azure AI Search 或存储。

参考