由于训练数据中特定人口群体的代表性不足,AI 模型对该群体表现不佳。
使用 Azure 机器学习负责任 AI 仪表板识别和衡量公平性差异(例如,人口统计学平等)。通过数据增强、重采样或使用公平性感知算法来缓解偏见。
原因: 公平性要求对所有群体一视同仁。简单地移除受保护属性是不够的,因为代理变量仍然可以编码偏见。
Microsoft Azure AI Fundamentals
最后审核:2026年5月
AI-900 考试涉及的架构模式快速参考。从头到尾阅读,或跳转到任意章节。
由于训练数据中特定人口群体的代表性不足,AI 模型对该群体表现不佳。
使用 Azure 机器学习负责任 AI 仪表板识别和衡量公平性差异(例如,人口统计学平等)。通过数据增强、重采样或使用公平性感知算法来缓解偏见。
原因: 公平性要求对所有群体一视同仁。简单地移除受保护属性是不够的,因为代理变量仍然可以编码偏见。
监管机构要求对每一个由 AI 驱动的贷款拒绝决定提供解释。
通过负责任 AI 仪表板使用模型可解释性和解释技术,如 SHAP (SHapley Additive exPlanations),为个体预测生成特征重要性分数。
原因: 透明度旨在使 AI 决策易于理解。聚合准确性指标不足以解释个体结果。
一个高风险的 AI 系统(例如,医疗诊断)在其实施建议之前需要人工监督。
实施人机协作工作流,由合格人员审查、批准或否决 AI 生成的建议。
原因: 问责制确保人类最终对 AI 系统结果负责,尤其是在关键应用中。
必须防止 AI 驱动的聊天机器人在医疗保健等敏感领域提供有害或不正确的建议。
实施严格的测试、性能监控和内容过滤。建立操作边界,以防止在非预期或有害情境中使用。
原因: 可靠性和安全性要求 AI 系统始终如一地运行,且不造成损害。
从大量非结构化文档(PDF、DOCX、图像)的异构语料库中提取可搜索的洞察、实体和关系。
使用 Azure AI Search。创建一个富集管道,利用 AI 技能(例如,OCR、实体识别、语言检测)对内容进行索引,以实现语义搜索。
原因: 知识挖掘旨在从非结构化数据创建结构化、可搜索的索引,而不仅仅是处理单个文档。
监控工厂设备的实时传感器数据,检测指示即将发生故障的异常模式。
使用 Azure Anomaly Detector 服务。将时间序列数据流式传输到服务 API,以实时识别异常值。
原因: Anomaly Detector 是一种预构建服务,专门用于识别时间序列数据中的异常模式,无需自定义模型训练。
工厂车间的人工智能质量检测系统要求推理时间低于 50 毫秒,并且必须在互联网连接间歇性中断的情况下运行。
将优化后的 AI 模型(例如 ONNX 格式)部署到边缘设备(如 Azure IoT Edge)以进行本地推理。
原因: 边缘 AI 通过本地处理数据来满足低延迟和离线要求,避免了与云的网络往返。
预测连续的数值,例如房价或未来销售收入。
使用回归算法(例如,线性回归、梯度提升树)。使用均方根误差 (RMSE) 或平均绝对误差 (MAE) 等指标进行评估。
原因: 回归用于解决“多少?”或“多少个?”的问题。分类用于解决“哪个类别?”的问题。
预测离散类别,例如交易是“欺诈”还是“合法”。
使用分类算法(例如,逻辑回归、随机森林)。对于两个类别,使用二元分类。对于三个以上类别,使用多类别分类。使用混淆矩阵、精确度和召回率进行评估。
原因: 分类从预定义的类别集合中预测标签。
在客户数据集中发现自然分组,以创建有针对性的营销细分,而无需预定义类别。
使用无监督聚类算法,如 K-Means。数据是未标记的。
原因: 聚类是一种无监督技术,用于在未标记数据中发现结构。当没有预定义的目标进行预测时使用它。
一个机器学习专业知识有限的团队需要通过自动测试多种算法和超参数来快速构建模型。
在 Azure 机器学习中使用自动化机器学习 (AutoML)。指定任务(分类、回归),让 AutoML 迭代模型以找到最佳表现者。
原因: AutoML 自动化了算法选择和超参数调优的耗时任务,加速了模型开发。
公民数据科学家需要使用可视化、无代码、拖放界面构建 ML 管道。
使用 Azure 机器学习设计器。在可视化画布上连接用于数据引入、转换、训练和评分的预构建模块。
原因: 设计器是用于构建 ML 管道的无代码/低代码解决方案,与代码优先的 SDK 方法不同。
数据科学家需要交互式开发环境 (Jupyter) 和可扩展的多节点资源用于批量训练。
使用 Azure ML 计算实例进行交互式开发。使用 Azure ML 计算群集进行可扩展的分布式训练。
原因: 计算实例是用于开发的单节点工作站。计算群集是用于生产训练和批量推理的多节点、自动伸缩资源。
一个模型必须为 Web 应用提供即时预测,而另一个模型需要在夜间对数百万条记录进行评分。
将 Web 应用模型部署到实时托管在线端点。将批量评分模型部署到批量端点。
原因: 在线端点适用于低延迟、同步推理。批量端点适用于大吞吐量、异步评分大型数据集。
在包含 99% 非欺诈交易的数据上训练的欺诈检测模型表现不佳,错过了大多数实际的欺诈案例。
解决严重的类别不平衡问题。技术包括过采样少数类别(例如 SMOTE)、欠采样多数类别或使用类别加权损失函数。
原因: 对于不平衡数据,模型可以通过简单地预测多数类别来达到高准确率。应关注少数类别的召回率和精确度等指标。
识别仓库传送带上的多个物品,并用边界框提供每个物品的位置。
使用对象检测模型。此任务为每个找到的对象返回一个类别标签和边界框的坐标。
原因: 对象检测回答“这张图片里有什么,它在哪里?”。图像分类只回答“这张图片里有什么?”。
将扫描图像中的手写市议会会议记录数字化,使其可搜索。
使用带有 Read API (OCR) 的 Azure AI 视觉服务。它支持打印和手写文本。
原因: OCR(光学字符识别)是专门用于从图像中提取文本的任务。Read API 是 Azure 最先进的 OCR 引擎。
在 MRI 扫描中识别肿瘤的精确边界,将每个像素分类为“肿瘤”或“健康组织”。
使用图像分割。此技术对图像中的每个像素进行分类,提供对象的精确轮廓。
原因: 分割提供像素级别的细节,这比对象检测的边界框更精确。
使用每个类别仅 75 张带标签的图像,构建一个模型来分类 50 种特定类型的美食菜肴。
使用 Azure AI Custom Vision 服务。它利用迁移学习,通过小数据集构建有效的自定义分类器。
原因: Custom Vision 非常适合在训练数据有限的情况下进行领域特定的分类任务,避免了对大型通用模型的需求。
安全系统必须检测一个人,确定其大致年龄,并验证他们是真人,而非照片。
使用 Azure AI 人脸服务。使用人脸检测来识别属性(年龄、眼镜),并使用活体检测来防止欺骗。
原因: 人脸服务提供人脸检测、属性分析、验证、识别和防欺骗的专业能力,这是通用视觉服务所缺乏的。
从各种格式的数千张发票中自动提取结构化数据(供应商名称、发票号码、行项目、总计)。
使用 Azure AI Document Intelligence(以前称为 Form Recognizer)及其预构建的发票模型。
原因: Document Intelligence 专为理解文档结构并提取键值对和表格而构建,其能力远超简单的 OCR。
分析视频库,自动创建可搜索的索引,包含口语词汇、已识别的说话者、视觉文本和主题。
使用 Azure AI Video Indexer。它将多个 AI 模型(语音转文本、OCR、人脸检测、主题建模)组合成一个服务,用于深度视频分析。
原因: Video Indexer 是从视频内容中提取多模态洞察的综合服务,而不仅仅是分析单个帧。
一家零售店希望通过在实时视频中统计进入特定促销区域的人数来分析客流量。
使用 Azure AI 视觉的空间分析功能。配置区域和跨线事件以监控人员移动。
原因: 空间分析专为使用视频流理解物理空间中人员移动而设计,这是一项超越通用对象检测的专业任务。
应用程序需要自动识别并标记新闻文章中提到的特定公司、人物和地点。
使用 Azure AI 语言服务的命名实体识别 (NER) 功能。
原因: NER 专门识别已知实体并将其分类为预定义类型。关键短语提取可以找到重要主题,但不会对其进行分类。
分析产品评论,不仅要确定整体情感,还要确定“电池续航”被视为积极的,而“屏幕”被视为消极的。
在 Azure AI 语言服务中使用情感分析与观点挖掘功能。
原因: 观点挖掘(基于方面的情感)通过将情感与文本中的特定属性(目标)关联起来,提供细粒度的洞察。
创建一个聊天机器人,使用公司现有的常见问题解答文档和产品手册作为知识库来回答客户问题。
使用 Azure AI 语言的自定义问题解答功能。摄取文档以创建服务可查询的知识库。
原因: 问题解答旨在从给定文本语料库中找到最佳答案,这非常适合常见问题解答和知识库场景。
构建一个虚拟助手,能够理解用户意图,例如“重置密码”或“预订航班”,并提取相关实体(例如目的地、日期)。
在 Azure AI 语言中使用对话语言理解 (CLU) 来构建一个自定义模型,将语句映射到意图和实体。
原因: CLU 专为理解短语句中的对话意图而构建,这与分析长篇文档不同。
将收到的支持电子邮件自动分类到预定义类别,如“账单”、“技术”或“账户查询”。
使用 Azure AI 语言的自定义文本分类功能。为每个类别使用带标签的示例训练模型。
原因: 这是一个经典的文档分类任务。自定义分类允许您定义自己的业务特定类别。
语音启用应用程序必须将口头命令转换为文本,然后生成听起来自然的语音响应。
使用 Azure AI 语音服务。使用语音转文本 API 进行转录,使用文本转语音 API 进行合成。
原因: 语音服务是所有语音相关 AI 任务的中心枢纽,包括转录、合成、翻译和说话人识别。
一个基于语音的安全系统需要验证说话人是否如其所声称的身份。
使用 Azure AI 语音的说话人识别功能,根据已注册的声纹执行说话人验证。
原因: 说话人识别通过其独特的语音特征来识别或验证一个人,这与仅仅转录他们所说内容不同。
一个电子商务平台需要将产品描述翻译成 30 种不同语言,同时保留 HTML 格式。
使用 Azure AI Translator 服务。它支持 100 多种语言的文本和文档翻译,并能保留格式。
原因: Translator 是专用的、可扩展的多语言翻译服务,比通用语言模型更适合此任务。
从单个代码库将聊天机器人部署到多个渠道,包括公司网站、Microsoft Teams 和 Slack。
使用 Azure Bot Service。它提供了一个框架和通道连接器,用于管理跨各种平台的通信。
原因: Bot Service 处理将对话式 AI 核心(如 CLU 或 QnA)适应不同聊天平台特定协议的复杂性。
聊天机器人必须完全基于公司内部、频繁更新的知识库来回答问题,而不是其通用的预训练知识。
实施检索增强生成 (RAG) 模式。使用 Azure AI Search 检索相关文档,并将其作为上下文传递给 Azure OpenAI 模型以生成有依据的答案。
原因: RAG 将模型基于特定的、当前数据,无需昂贵的再训练,从而减少幻觉,并确保来自可信来源的事实准确性。
开发人员需要一个 GPT 模型以特定格式(例如 JSON)响应。
使用少样本提示。在实际请求之前,直接在提示中提供 2-3 个所需输入-输出格式的示例。
原因: 少样本提示通过上下文示例引导模型的行为和输出结构,这比微调更快、更便宜。
提高模型在多步推理问题(例如数学应用题)上的准确性。
通过在提示中添加“逐步思考”之类的短语来使用思维链 (CoT) 提示。
原因: CoT 鼓励模型分解问题并展示其推理过程,这显著提高了复杂逻辑任务的性能。
控制生成模型文本输出的创造性与可预测性。
调整 `temperature` 参数。较低的值(~0.1)使输出更具确定性和集中性。较高的值(~0.9)使其更具创造性和随机性。
原因: Temperature 直接控制令牌选择的随机性,允许您根据特定用例(例如事实摘要与创意写作)调整输出风格。
企业需要在其安全的 Azure 环境中使用 OpenAI 的 GPT-4 和 DALL-E 模型,并集成私有网络和身份管理。
使用 Azure OpenAI 服务。它为 OpenAI 模型提供 Azure 的企业级安全性、合规性、区域可用性和内容过滤。
原因: Azure OpenAI 为 OpenAI 模型提供了一个安全、企业级的封装,将其集成到 Azure 生态系统中。
构建一个基于语义而非关键词匹配来查找文档的搜索系统(例如,“汽车保养”可以找到“车辆服务间隔”)。
使用 Azure OpenAI 嵌入模型(例如 `text-embedding-ada-002`)将文档和查询转换为数值向量。使用向量数据库(如 Azure AI Search)通过余弦相似度查找最近的向量。
原因: 嵌入捕获文本的语义含义,从而实现基于概念相似性而非词汇重叠的搜索。
使用 Azure OpenAI 的应用程序必须自动阻止生成与暴力、仇恨言论、色情内容或自残相关的内容。
依靠由 Azure AI Content Safety 提供支持的内置内容过滤。为每个有害类别配置严重级别(低、中、高)。
原因: Azure OpenAI 包含一个强制性的多层安全系统,可过滤提示和完成内容,以符合负责任的 AI 原则。
营销团队需要根据文本描述为广告活动生成自定义产品图像。
使用通过 Azure OpenAI 服务提供的 DALL-E 模型。精心制作详细的提示来描述所需的图像。
原因: DALL-E 是一种文本到图像生成模型,专门设计用于从自然语言提示创建新颖图像。
生成式 AI 助手需要通过调用外部 API 来访问实时数据(例如,当前股票价格)或执行操作(例如,预订会议)。
使用 Azure OpenAI 模型的函数调用功能。在 API 请求中定义可用函数;模型将生成一个结构化的 JSON 对象,指定要调用哪个函数以及使用哪些参数。
原因: 函数调用允许 LLM 与外部工具和 API 交互,克服了其静态训练数据的限制,并使它们能够采取行动。
团队需要通过在可视化工作流中编排 LLM 调用、Python 脚本和提示模板来构建、评估和部署复杂的生成式 AI 应用程序。
使用 Azure AI Foundry(前身为 AI Studio)及其 Prompt flow 功能。将应用程序构建为连接工具的可视化图。
原因: Prompt flow 是用于构建和测试复杂基于 LLM 应用程序的编排工具,将多个组件链接成可复现的工作流。
IT 团队需要使用低代码平台构建一个用于内部使用的自定义 Copilot,该 Copilot 能够回答员工问题并与企业系统(例如 ServiceNow、SAP)集成。
使用 Microsoft Copilot Studio。它提供一个低代码图形界面,用于构建具有预构建连接器和生成式 AI 功能的自定义 Copilot。
原因: Copilot Studio 抽象了构建企业级 AI 助手的复杂性,无需大量编码即可实现快速开发。