Справочник

Microsoft Azure AI Engineer Associate

Последняя проверка: май 2026 г.

Сжатый справочник архитектурных шаблонов, проверяемых на экзамене AI-102. Читайте сверху вниз или переходите к нужному разделу.

Планирование, управление и защита решения Azure AI

Автоматизируйте ротацию ключей API для службы ИИ без простоя приложения.

Храните как первичные, так и вторичные ключи в Azure Key Vault с автоматической ротацией. Настройте приложение на использование вторичного ключа, если первичный не работает.

Почему: Key Vault управляет жизненным циклом ротации. Паттерн с двумя ключами гарантирует, что один ключ всегда будет действителен в течение периода ротации.

Обеспечьте, чтобы трафик службы ИИ никогда не покидал VNet и Microsoft не могла использовать данные клиентов для улучшения службы.

Разверните службу ИИ с частной конечной точкой и отключите доступ к публичной сети. Отдельно включите параметр отказа от обработки данных для ресурса.

Почему: Private Endpoint обеспечивает сетевую изоляцию. Отказ от обработки данных — это отдельная настройка для конфиденциальности данных. Одно не подразумевает другого.

Предоставьте приложению в Azure Kubernetes Service (AKS) безопасный, не требующий учетных данных доступ к службе ИИ.

Назначьте управляемое удостоверение, назначенное пользователем, подам AKS. Предоставьте этому удостоверению роль RBAC "Cognitive Services User" для ресурса службы ИИ.

Почему: Управляемое удостоверение — это стандартный паттерн аутентификации без пароля для ресурсов Azure, устраняющий необходимость хранения секретов в конфигурациях подов.

Источник

Отслеживайте затраты на службы ИИ и устанавливайте лимиты расходов для каждого отдела без использования отдельных подписок.

Создайте отдельные ресурсы службы ИИ для каждого отдела. Примените тег ресурса "department" к каждому. Настройте бюджеты Azure Cost Management с пороговыми значениями оповещений на основе значения тега.

Почему: Теги являются стандартом для распределения затрат. Бюджеты Azure могут быть применены к тегам для принудительного соблюдения лимитов расходов с помощью оповещений или действий.

Оповещать операторов, когда частота ошибок API службы ИИ превышает 5% или задержка превышает 2 секунды.

Настройте оповещения метрик Azure Monitor для ресурса службы ИИ. Используйте метрики "Failed Requests" и "Latency" с соответствующим периодом агрегации.

Почему: Azure Monitor предоставляет прямые метрики уровня платформы для производительности и надежности, обеспечивая оповещения в реальном времени без задержек запросов к журналам.

Разработайте план аварийного восстановления для пользовательских моделей ИИ (например, Custom Vision, LUIS) с низким RTO/RPO.

Разверните ресурсы в парных регионах. Автоматизируйте ежедневный экспорт моделей в геоизбыточное хранилище (GRS). Используйте Azure Traffic Manager для автоматического переключения при отказе на основе проверки работоспособности.

Почему: Службы AI PaaS не покрываются Azure Site Recovery. DR требует явного, скриптового экспорта/импорта моделей и службы маршрутизации трафика на уровне DNS.

Регистрируйте полные полезные данные запросов и ответов для всех вызовов службы ИИ для долгосрочного хранения аудита.

Разместите Azure API Management (APIM) перед службой ИИ. Настройте политики APIM для регистрации полных тел запросов/ответов. Отправляйте журналы в Azure Storage с политикой неизменяемости.

Почему: Нативная диагностика службы ИИ не регистрирует полные полезные данные. APIM является стандартным паттерном для фасада логирования и политик. Неизменяемое хранилище обеспечивает целостность аудиторского следа.

Развернуть медицинское решение ИИ, которое обрабатывает данные пациентов и должно соответствовать HIPAA.

Разверните ресурс ИИ в регионе Azure в США, который поддерживает HIPAA. Подпишите Соглашение о деловом сотрудничестве (BAA) с Microsoft для подписки.

Почему: Соответствие HIPAA требует как технических средств контроля (выбор региона), так и юридических соглашений (BAA). Оба являются обязательными.

Внедрите систему модерации контента, которая отмечает вредоносный контент, но позволяет человеку просматривать его перед блокировкой.

Используйте Azure AI Content Safety API. Автоматически блокируйте контент, помеченный как "высокая" серьезность. Помещайте контент, помеченный как "средняя" или "низкая" серьезность, в очередь для рабочего процесса проверки человеком.

Почему: Этот паттерн "человек в контуре" балансирует автоматическую безопасность с нюансами, необходимыми для модерации, предотвращая чрезмерную блокировку легитимного контента.

Реализация решений для обработки изображений и видео

Обнаруживайте и подсчитывайте конкретные фирменные продукты на полках розничных магазинов, справляясь с окклюзией и различной ориентацией.

Обучите модель обнаружения объектов Custom Vision. Используйте набор данных помеченных изображений, представляющих продукты в реалистичных условиях на полках.

Почему: Обнаружение объектов обеспечивает как классификацию, так и определение местоположения (для подсчета). Для распознавания конкретных SKU продуктов требуется пользовательская модель.

Источник

Выполняйте анализ изображений для контроля качества в реальном времени на заводе с ненадежным подключением к Интернету.

Разверните контейнер Azure AI Vision для анализа изображений на периферийном устройстве (например, Azure IoT Edge).

Почему: Контейнеры упаковывают облачные модели ИИ для локального выполнения, обеспечивая низкую задержку и автономную работу, при этом позволяя обновлять модели при подключении.

Извлекайте текст из отсканированных исторических документов, содержащих смешанный печатный, рукописный текст и несколько языков.

Используйте Azure AI Vision Read API (часть Image Analysis). Укажите последнюю версию модели для обеспечения наилучшей производительности на смешанном контенте.

Почему: Read API — это самый передовой движок OCR от Azure, специально оптимизированный для сценариев с документами и смешанным контентом, превосходящий старые OCR API.

Анализируйте видеопотоки для мониторинга заполняемости магазина, отслеживания паттернов движения покупателей и измерения длины очередей.

Разверните контейнер Azure AI Vision Spatial Analysis на периферийном устройстве, подключенном к камерам магазина.

Почему: Spatial Analysis — это специализированное контейнерное решение для пространственного анализа видео в реальном времени, предоставляющее такие операции, как `personcount`, `persondistance` и `personcrossingline`.

Модель обнаружения объектов Custom Vision имеет высокую точность, но низкую полноту (пропускает много объектов).

Расширьте обучающий набор данных более разнообразными примерами пропущенных объектов, в частности изображениями с различным освещением, углами, размерами и частичной окклюзией.

Почему: Низкая полнота — это проблема количества/разнообразия данных. Модель не видела достаточного количества вариаций, чтобы эффективно обобщать. Добавление разнообразных примеров является основным решением.

Реализация решений для обработки естественного языка

Анализируйте отзывы клиентов для выявления настроений в отношении конкретных функций продукта (например, положительные для "время работы от батареи", отрицательные для "экран").

Используйте Azure AI Language Sentiment Analysis API с включенным параметром `opinionMining`.

Почему: Opinion Mining (также называемый Aspect-Based Sentiment Analysis) — это специфическая функция, предназначенная для извлечения настроений, связанных с отдельными целями (аспектами) в тексте.

Источник

Создайте FAQ-бота, который поддерживает множество языков, но использует единую базу знаний, написанную на английском.

Используйте функцию Custom Question Answering службы Azure AI Language. Она имеет встроенный перевод запросов для сопоставления вопросов с англоязычной базой знаний.

Почему: Встроенная функция перевода устраняет необходимость поддерживать отдельные базы знаний для каждого языка, что значительно упрощает управление контентом.

Модель Conversational Language Understanding (CLU) путает два схожих намерения (например, "ЗаказатьПиццу" и "ИзменитьЗаказ").

Добавьте более разнообразные обучающие высказывания к обоим намерениям, сосредоточившись на примерах, которые подчеркивают отличительные ключевые слова и фразы. Просмотрите и удалите неоднозначные или пересекающиеся примеры.

Почему: Точность модели в основном определяется качеством и ясностью обучающих данных. Цель состоит в том, чтобы создать четкую "границу принятия решений" между намерениями.

Извлекайте специфические для домена сущности, такие как "ContractValue" или "TerminationClause", из юридических документов.

Обучите пользовательскую модель распознавания именованных сущностей (NER) с использованием Azure AI Language. Предоставьте помеченные примеры из ваших документов.

Почему: Предварительно обученные модели NER распознают только общие сущности (Person, Location и т. д.). Пользовательский NER требуется для любой задачи извлечения сущностей, специфичных для домена.

Автоматически находите и редактируйте персонально идентифицируемую информацию (PII), такую как имена и номера телефонов, из текста.

Используйте Azure AI Language PII detection API. Настройте категории сущностей для обнаружения и установите режим редактирования.

Почему: Это специально разработанный API для PII, более надежный и всеобъемлющий, чем регулярные выражения или общий NER, для этой конкретной задачи соответствия требованиям.

Извлекайте медицинские сущности, отношения и утверждения (например, отрицание) из клинических записей.

Используйте Azure AI Health Insights, в частности службу Text Analytics for Health.

Почему: Это специализированная, соответствующая HIPAA служба, обученная на медицинских онтологиях (например, UMLS), обеспечивающая глубокое понимание клинического текста, чего не хватает общим моделям NLP.

Переводите технические документы, обеспечивая правильный перевод отраслевой терминологии и торговых марок.

Используйте Azure Custom Translator. Обучите пользовательскую модель, используя корпус ваших существующих переведенных документов (параллельные документы).

Почему: Custom Translator адаптируется к словарному запасу и стилю вашего конкретного домена, обеспечивая более высокую точность, чем общецелевая модель перевода, которая может неправильно перевести нишевые термины.

Транскрибируйте встречу с несколькими участниками в реальном времени и приписывайте текст каждому говорящему.

Используйте службу Azure AI Speech to Text с включенной транскрипцией разговоров и диаризацией.

Почему: Диаризация — это специфическая функция, которая сегментирует аудио по говорящим, предоставляя информацию "кто что сказал" вместе с транскрипцией.

Повысьте точность преобразования речи в текст для аудио, содержащего специфичные для домена акронимы, жаргон или собственные имена.

Обучите пользовательскую речевую модель. Предоставьте набор данных аудиообразцов с соответствующими транскриптами, помеченными человеком, и файл произношения для пользовательских терминов.

Почему: Пользовательские модели адаптируют базовые акустические и языковые модели к вашей конкретной аудиосреде, стилям речи и словарному запасу для значительно более высокой точности.

Контролируйте ударение, высоту тона, скорость и паузы при синтезе речи для модуля электронного обучения.

Используйте Speech Synthesis Markup Language (SSML) в запросе к Text-to-Speech API.

Почему: SSML — это стандарт W3C для предоставления подробных инструкций синтезатору речи, позволяющий осуществлять тонкий контроль помимо ввода обычного текста.

Реализация решений для интеллектуального анализа знаний и документов

Разработайте поисковое решение для более чем 10 миллионов документов, требующее низкой задержки для большого объема одновременных запросов.

Используйте Azure AI Search уровня Standard или выше. Масштабируйте с помощью реплик для обработки запросной нагрузки и с помощью разделов для обработки объема данных.

Почему: Реплики предназначены для пропускной способности запросов (QPS). Разделы предназначены для размера индекса и ввода/вывода. Оба необходимы для высокомасштабных, высокопроизводительных сценариев.

Позвольте пользователям задавать вопросы на естественном языке (например, "Какова политика возврата?") и получать прямые ответы из коллекции документов.

Используйте Azure AI Search с включенным семантическим поиском. Используйте функции семантических ответов и подписей.

Почему: Семантический поиск выходит за рамки сопоставления ключевых слов, чтобы понять намерения пользователя и может извлекать и возвращать прямые, краткие ответы из исходного текста.

Источник

Реализуйте поиск продукта, который находит точные совпадения для номеров моделей (ключевое слово) и концептуально похожие элементы (семантический).

Настройте индекс Azure AI Search с полями searchable text и vector. Выполняйте гибридные запросы, которые объединяют параметры ключевого слова (`search`) и вектора (`vectorQueries`).

Почему: Гибридный поиск объединяет точность ранжирования по ключевым словам BM25 с концептуальной релевантностью векторного сходства, обеспечивая лучшее из обоих миров.

Извлекайте пользовательские отформатированные сущности, такие как коды продуктов (XX-####), во время конвейера индексации Azure AI Search.

Создайте пользовательский набор навыков, который вызывает функцию Azure Function. Функция содержит регулярное выражение или другую пользовательскую логику для поиска и извлечения сущностей.

Почему: Пользовательские навыки предоставляют точку расширения в конвейере обогащения для любой логики, не охватываемой встроенными когнитивными навыками.

Убедитесь, что запросы "ноутбук", "лэптоп" и "ультрабук" возвращают один и тот же набор релевантных документов.

Создайте карту синонимов в Azure AI Search, определяющую эквивалентные термины. Свяжите карту синонимов с соответствующими полями для поиска в определении индекса.

Почему: Карты синонимов — это специализированная функция для расширения запросов, включающая определяемые пользователем эквивалентные термины, что напрямую улучшает полноту поиска.

При обновлении набора навыков Azure AI Search повторно обрабатывайте только те документы, на которые повлияли изменения, чтобы сэкономить время и затраты.

Включите кеширование обогащения в конфигурации индексатора. Индексатор затем будет использовать кешированные результаты для неизменных навыков и повторно запускать только новые или измененные навыки.

Почему: Кеширование промежуточных результатов навыков является ключом к обеспечению эффективного инкрементного обогащения, избегая дорогостоящей полной переобработки всего набора данных.

Организуйте конвейер для извлечения данных из различных документов (например, счетов-фактур), их проверки на соответствие бизнес-правилам и сохранения структурированных выходных данных.

Используйте составную модель в Azure AI Document Intelligence для извлечения, Azure Function для пользовательской логики проверки и Azure Cosmos DB для хранения. Организуйте с помощью Azure Logic Apps.

Почему: Эта бессерверная архитектура правильно разделяет обязанности: Document Intelligence для специализированного извлечения, Functions для индивидуальной бизнес-логики и Logic Apps для оркестрации рабочего процесса.

Обрабатывайте пакет документов, содержащий несколько типов форм (например, форму претензии, квитанции и фотографии) в рамках одной транзакции.

Используйте составную модель Azure AI Document Intelligence. Обучите модель классификации для определения типа документа и маршрутизации его к соответствующей пользовательской или предварительно созданной модели извлечения.

Почему: Составные модели действуют как маршрутизатор, позволяя одной конечной точке интеллектуально обрабатывать смесь типов документов, каждый из которых обрабатывается своей оптимальной моделью.

Удаляйте PII из документов до их индексации Azure AI Search, чтобы конфиденциальные данные никогда не хранились в поисковом индексе.

Добавьте когнитивный навык PII Detection в набор навыков индексатора. Настройте навык для маскирования PII и сопоставьте поле отредактированного текста с индексом.

Почему: Это выполняет редактирование "на лету" во время индексации, гарантируя чистоту содержимого для поиска с самого начала, что является критически важным паттерном безопасности и соответствия требованиям.

Повышайте релевантность результатов поиска на основе давности документа (даты публикации) и популярности (количества просмотров).

Определите пользовательский профиль оценки в Azure AI Search. Используйте функцию `freshness` для поля даты и функцию `magnitude` для поля количества просмотров.

Почему: Профили оценки позволяют изменять базовую оценку релевантности BM25, включая бизнес-специфичные сигналы из метаданных документа.

Реализация решений генеративного ИИ

Чат-боту Azure OpenAI необходимо предоставлять последовательные, сфокусированные и некреативные ответы для сценария обслуживания клиентов.

Установите параметр `temperature` на низкое значение, например 0,1 или 0,2. Избегайте установки его точно в 0 для большинства моделей.

Почему: Температура контролирует случайность вывода. Её снижение делает модель более детерминированной и с большей вероятностью выбирающей токены с наивысшей вероятностью.

В решении RAG убедитесь, что генеративная модель синтезирует ответы только из документов, к которым конкретный пользователь имеет доступ.

Внедрите обрезку безопасности на этапе извлечения. В Azure AI Search примените фильтры безопасности к поисковому запросу на основе идентификатора AAD пользователя и членства в группах.

Почему: Контроль доступа должен быть обеспечен до того, как LLM увидит данные. Фильтрация на уровне поиска (извлечения) является единственным безопасным способом реализации этого.

Последовательно извлекайте структурированные данные из неструктурированного текста в действительный объект JSON с помощью Azure OpenAI.

Используйте подсказку, которая включает: 1) Четкую роль. 2) Явную инструкцию возвращать ТОЛЬКО JSON. 3) Желаемую JSON-схему с именами полей и типами. 4) Примеры в несколько шагов, если возможно.

Почему: Высокоструктурированные и явные подсказки значительно повышают надежность получения хорошо сформированного, структурированного вывода от LLM.

Критически важное приложение требует гарантированной, стабильной пропускной способности от Azure OpenAI без дросселирования во время пиковой нагрузки.

Приобретите и разверните модель с использованием Provisioned Throughput Units (PTU).

Почему: PTU предоставляют выделенную, зарезервированную мощность обработки модели, в отличие от стандартных развертываний с оплатой по мере использования, которые работают по модели общей мощности и подвержены дросселированию.

Источник

Сохраняйте контекст в длительной беседе с чат-ботом, не превышая лимит токенов модели.

Внедрите стратегию суммирования разговоров. Периодически используйте отдельный вызов LLM для суммирования более старых частей разговора и включайте это суммирование, а также самые последние реплики в подсказку.

Почему: Этот паттерн "суммируй и сдвигай" сохраняет долгосрочный контекст гораздо более эффективно и экономично, чем простое усечение или отправка всей (и в конечном итоге слишком длинной) истории.

Разрешите модели Azure OpenAI вызывать внешний API для получения текущей информации о погоде.

Определите API как инструмент для модели, используя точный формат JSON Schema. Включите четкое `description` функции и подробные `parameter` описания, чтобы модель знала, когда и как его использовать.

Почему: Модель полностью полагается на схему и описания для принятия обоснованного решения о вызове функции. Хорошо описанная функция критически важна для надежности.

Используйте Azure OpenAI для суммирования документа, который намного длиннее контекстного окна модели.

Реализуйте стратегию "map-reduce" или "refine". Разбейте документ на части, сгенерируйте краткое изложение для каждой части (map), а затем сгенерируйте итоговое краткое изложение из коллекции кратких изложений частей (reduce).

Почему: Это стандартный паттерн для применения моделей с фиксированным контекстом к произвольно длинным входам, гарантирующий учет всего содержимого документа.

Повысьте воспринимаемую отзывчивость чат-приложения, отображая ответ ИИ по мере его генерации.

При вызове Chat Completions API установите параметр `stream` в `true`. Обрабатывайте события, отправляемые сервером, по мере их поступления, чтобы построить ответ токен за токеном.

Почему: Потоковая передача обеспечивает гораздо лучший пользовательский опыт для приложений реального времени, чем ожидание генерации полного ответа, что может занять несколько секунд.

Агент ИИ должен динамически решать, какой из нескольких инструментов (например, запрос к базе данных, веб-поиск, отправка электронной почты) использовать для выполнения запроса пользователя.

Используйте фреймворк, такой как Semantic Kernel или Azure AI Agent Service. Определите каждую возможность как отдельный инструмент/плагин и позвольте планировщику агента или циклу ReAct оркестрировать вызовы инструментов.

Почему: Агентные фреймворки предоставляют слой оркестрации (планировщик/цикл рассуждений), который позволяет LLM выйти за рамки простых вопросов и ответов и стать автономным актором, использующим инструменты.

Предотвратите выполнение автономным агентом ИИ высокорисковых действий (например, удаление данных, трата денег) без надзора.

Внедрите паттерн "человек в контуре". Когда агент планирует высокорисковое действие, система должна приостановиться и потребовать явного подтверждения от оператора-человека перед выполнением.

Почему: Это критически важный паттерн ответственного ИИ для агентных систем, балансирующий автономию с безопасностью путем ограничения необратимых или высокоэффективных действий.

Справочник

Microsoft Azure AI Engineer Associate

Последняя проверка: май 2026 г.

Планирование, управление и защита решения Azure AI

Автоматизируйте ротацию ключей API для службы ИИ без простоя приложения.

Предоставьте приложению в Azure Kubernetes Service (AKS) безопасный, не требующий учетных данных доступ к службе ИИ.

Источник

Оповещать операторов, когда частота ошибок API службы ИИ превышает 5% или задержка превышает 2 секунды.

Развернуть медицинское решение ИИ, которое обрабатывает данные пациентов и должно соответствовать HIPAA.

Реализация решений для обработки изображений и видео

Источник

Разверните контейнер Azure AI Vision для анализа изображений на периферийном устройстве (например, Azure IoT Edge).

Разверните контейнер Azure AI Vision Spatial Analysis на периферийном устройстве, подключенном к камерам магазина.

Модель обнаружения объектов Custom Vision имеет высокую точность, но низкую полноту (пропускает много объектов).

Реализация решений для обработки естественного языка

Используйте Azure AI Language Sentiment Analysis API с включенным параметром `opinionMining`.

Источник

Модель Conversational Language Understanding (CLU) путает два схожих намерения (например, "ЗаказатьПиццу" и "ИзменитьЗаказ").

Извлекайте специфические для домена сущности, такие как "ContractValue" или "TerminationClause", из юридических документов.

Извлекайте медицинские сущности, отношения и утверждения (например, отрицание) из клинических записей.

Используйте Azure AI Health Insights, в частности службу Text Analytics for Health.

Используйте службу Azure AI Speech to Text с включенной транскрипцией разговоров и диаризацией.

Контролируйте ударение, высоту тона, скорость и паузы при синтезе речи для модуля электронного обучения.

Используйте Speech Synthesis Markup Language (SSML) в запросе к Text-to-Speech API.

Реализация решений для интеллектуального анализа знаний и документов

Источник

Убедитесь, что запросы "ноутбук", "лэптоп" и "ультрабук" возвращают один и тот же набор релевантных документов.

Реализация решений генеративного ИИ

Приобретите и разверните модель с использованием Provisioned Throughput Units (PTU).

Источник

Сохраняйте контекст в длительной беседе с чат-ботом, не превышая лимит токенов модели.

Разрешите модели Azure OpenAI вызывать внешний API для получения текущей информации о погоде.

Используйте Azure OpenAI для суммирования документа, который намного длиннее контекстного окна модели.

Повысьте воспринимаемую отзывчивость чат-приложения, отображая ответ ИИ по мере его генерации.