Guide

Microsoft Azure AI Engineer Associate

Dernière révision : mai 2026

Une référence concise des modèles d'architecture évalués par l'examen AI-102. Lisez de haut en bas ou sautez à une section.

Planifier, gérer et sécuriser une solution Azure AI

Automatiser la rotation des clés API pour un service d'IA sans temps d'arrêt de l'application.

Stocker les clés primaires et secondaires dans Azure Key Vault avec rotation automatique. Configurer l'application pour qu'elle essaie la clé secondaire si la clé primaire échoue.

Pourquoi: Key Vault gère le cycle de vie de la rotation. Le modèle à double clé garantit qu'une clé est toujours valide pendant la fenêtre de rotation.

S'assurer que le trafic du service d'IA ne quitte jamais le VNet et que Microsoft ne peut pas utiliser les données client pour l'amélioration du service.

Déployer le service d'IA avec un point de terminaison privé et désactiver l'accès au réseau public. Séparément, activer le paramètre de désactivation du traitement des données sur la ressource.

Pourquoi: Private Endpoint assure l'isolation du réseau. La désactivation des données est un paramètre distinct pour la confidentialité des données. L'un n'implique pas l'autre.

Fournir à une application dans Azure Kubernetes Service (AKS) un accès sécurisé et sans identifiants à un service d'IA.

Attribuer une identité gérée attribuée par l'utilisateur aux pods AKS. Accorder à cette identité le rôle RBAC "Utilisateur des services cognitifs" sur la ressource du service d'IA.

Pourquoi: L'identité gérée est le modèle d'authentification sans mot de passe standard pour les ressources Azure, éliminant le besoin de stocker des secrets dans les configurations de pod.

Référence

Suivre les coûts des services d'IA et appliquer des limites de dépenses par département sans utiliser d'abonnements distincts.

Créer des ressources de service d'IA distinctes par département. Appliquer une étiquette de ressource "département" à chacune. Configurer les budgets Azure Cost Management avec des seuils d'alerte basés sur la valeur de l'étiquette.

Pourquoi: Les étiquettes sont la norme pour l'allocation des coûts. Les budgets Azure peuvent être appliqués aux étiquettes pour faire respecter les limites de dépenses via des alertes ou des actions.

Alerter les opérations lorsque les taux d'erreur de l'API du service d'IA dépassent 5 % ou que la latence dépasse 2 secondes.

Configurer les alertes de métriques Azure Monitor sur la ressource du service d'IA. Utiliser les métriques "Requêtes échouées" et "Latence" avec une période d'agrégation appropriée.

Pourquoi: Azure Monitor fournit des métriques directes au niveau de la plateforme pour les performances et la fiabilité, permettant une alerte en temps réel sans les délais des requêtes de journal.

Concevoir un plan de reprise après sinistre pour les modèles d'IA personnalisés (par exemple, Custom Vision, LUIS) avec un RTO/RPO faible.

Déployer des ressources dans des régions appariées. Automatiser l'exportation quotidienne des modèles vers un stockage géoredondant (GRS). Utiliser Azure Traffic Manager pour un basculement automatique basé sur des sondes de santé.

Pourquoi: Les services PaaS d'IA ne sont pas couverts par Azure Site Recovery. La DR nécessite une exportation/importation explicite et scriptée des modèles et un service de routage de trafic au niveau DNS.

Enregistrer les charges utiles complètes des requêtes et réponses pour tous les appels de service d'IA pour une rétention d'audit à long terme.

Placer Azure API Management (APIM) devant le service d'IA. Configurer les politiques APIM pour enregistrer les corps de requêtes/réponses complets. Envoyer les journaux à Azure Storage avec une politique d'immuabilité.

Pourquoi: Les diagnostics natifs des services d'IA n'enregistrent pas les charges utiles complètes. APIM est le modèle standard pour une façade de journalisation et de politique. Le stockage immuable assure l'intégrité de la piste d'audit.

Déployer une solution d'IA pour les soins de santé qui traite des données de patients et doit être conforme à HIPAA.

Déployer la ressource IA dans une région Azure US qui prend en charge HIPAA. Signer un accord d'associé commercial (BAA) avec Microsoft pour l'abonnement.

Pourquoi: La conformité HIPAA exige à la fois des contrôles techniques (sélection de la région) et des accords légaux (BAA). Les deux sont obligatoires.

Mettre en œuvre un système de modération de contenu qui signale le contenu nuisible mais permet une révision humaine avant le blocage.

Utiliser l'API Azure AI Content Safety. Bloquer automatiquement le contenu signalé avec une gravité "élevée". Mettre en file d'attente le contenu signalé comme "moyen" ou "faible" pour un flux de travail de révision humaine.

Pourquoi: Ce modèle "humain dans la boucle" équilibre la sécurité automatisée avec la nuance requise pour la modération, empêchant le blocage excessif de contenu légitime.

Implémenter des solutions de traitement d'images et de vidéos

Détecter et compter des produits spécifiques et de marque sur les étagères des magasins de détail, en gérant l'occlusion et les orientations variables.

Entraîner un modèle de détection d'objets Custom Vision. Utiliser un jeu de données d'images étiquetées représentant les produits dans des environnements d'étagères réalistes.

Pourquoi: La détection d'objets fournit à la fois la classification et la localisation (pour le comptage). Un modèle personnalisé est nécessaire pour reconnaître les UGS de produits spécifiques.

Référence

Effectuer une analyse d'images en temps réel pour le contrôle qualité dans une usine avec une connectivité Internet peu fiable.

Déployer le conteneur Azure AI Vision pour l'analyse d'images sur un appareil Edge (par exemple, Azure IoT Edge).

Pourquoi: Les conteneurs regroupent les modèles d'IA cloud pour une exécution locale, offrant une faible latence et une capacité hors ligne tout en permettant les mises à jour de modèles lorsqu'ils sont connectés.

Extraire du texte de documents historiques numérisés contenant un mélange d'impression, de texte manuscrit et de plusieurs langues.

Utiliser l'API Azure AI Vision Read (faisant partie de l'analyse d'images). Spécifier la dernière version du modèle pour garantir les meilleures performances sur le contenu mixte.

Pourquoi: L'API Read est le moteur OCR le plus avancé d'Azure, spécifiquement optimisé pour les scénarios axés sur les documents et à contenu mixte, surpassant les anciennes API OCR.

Analyser les flux vidéo pour surveiller l'occupation des magasins, suivre les schémas de mouvement des clients et mesurer la longueur des files d'attente.

Déployer le conteneur Azure AI Vision Spatial Analysis sur un appareil Edge connecté aux caméras du magasin.

Pourquoi: Spatial Analysis est une solution conteneurisée spécialement conçue pour l'analyse spatiale en temps réel à partir de la vidéo, offrant des opérations comme `personcount`, `persondistance` et `personcrossingline`.

Un modèle de détection d'objets Custom Vision a une précision élevée mais un faible rappel (manque de nombreux objets).

Augmenter le jeu de données d'entraînement avec des exemples plus diversifiés des objets manqués, en particulier des images avec différents éclairages, angles, tailles et occlusions partielles.

Pourquoi: Un faible rappel est un problème de quantité/diversité des données. Le modèle n'a pas vu suffisamment de variations pour généraliser efficacement. L'ajout d'exemples variés est la solution principale.

Implémenter des solutions de traitement du langage naturel

Analyser les avis clients pour identifier le sentiment envers des caractéristiques spécifiques du produit (par exemple, positif pour "autonomie de la batterie", négatif pour "écran").

Utiliser l'API Azure AI Language Sentiment Analysis avec le paramètre `opinionMining` activé.

Pourquoi: Opinion Mining (également appelé analyse des sentiments basée sur les aspects) est la fonctionnalité spécifique conçue pour extraire le sentiment associé à des cibles individuelles (aspects) dans le texte.

Référence

Créer un bot FAQ qui prend en charge de nombreuses langues mais utilise une seule base de connaissances rédigée en anglais.

Utiliser la fonction Custom Question Answering d'Azure AI Language. Elle dispose d'une traduction de requête intégrée pour faire correspondre les questions à la base de connaissances en anglais.

Pourquoi: La capacité de traduction intégrée élimine le besoin de maintenir des bases de connaissances distinctes pour chaque langue, simplifiant considérablement la gestion du contenu.

Un modèle de Compréhension du Langage Conversationnel (CLU) confond deux intentions similaires (par exemple, "CommanderPizza" et "ModifierCommande").

Ajouter des énoncés d'entraînement plus diversifiés aux deux intentions, en se concentrant sur des exemples qui mettent en évidence les mots-clés et les phrases distinctifs. Rechercher et supprimer les exemples ambigus ou qui se chevauchent.

Pourquoi: La précision du modèle est principalement déterminée par la qualité et la clarté des données d'entraînement. L'objectif est de créer une "frontière de décision" claire entre les intentions.

Extraire des entités spécifiques au domaine comme "ValeurDuContrat" ou "ClauseDeRésiliation" de documents juridiques.

Entraîner un modèle de reconnaissance d'entités nommées (NER) personnalisé à l'aide d'Azure AI Language. Fournir des exemples étiquetés de vos documents.

Pourquoi: Les modèles NER pré-construits ne reconnaissent que les entités générales (Personne, Lieu, etc.). Le NER personnalisé est requis pour toute tâche d'extraction d'entités spécifiques au domaine.

Trouver et masquer automatiquement les informations d'identification personnelle (PII) comme les noms et les numéros de téléphone à partir du texte.

Utiliser l'API de détection de PII d'Azure AI Language. Configurer les catégories d'entités à détecter et définir le mode de masquage.

Pourquoi: Il s'agit d'une API spécialement conçue pour les PII, plus fiable et complète que les expressions régulières ou le NER générique pour cette tâche de conformité spécifique.

Extraire les entités médicales, les relations et les assertions (par exemple, la négation) des notes cliniques.

Utiliser Azure AI Health Insights, en particulier le service Text Analytics for Health.

Pourquoi: Il s'agit d'un service spécialisé, conforme à HIPAA, entraîné sur des ontologies médicales (par exemple, UMLS), offrant une compréhension approfondie du texte clinique qui manque aux modèles de PNL généraux.

Traduire des documents techniques, en s'assurant que la terminologie spécifique à l'industrie et les noms de marque sont traduits correctement.

Utiliser Azure Custom Translator. Entraîner un modèle personnalisé à l'aide d'un corpus de vos documents traduits existants (documents parallèles).

Pourquoi: Custom Translator s'adapte au vocabulaire et au style de votre domaine spécifique, offrant une fidélité plus élevée que le modèle de traduction généraliste, qui pourrait mal traduire des termes de niche.

Transcribe une réunion multi-participants en temps réel et attribuer le texte à chaque locuteur.

Utiliser le service Azure AI Speech to Text avec la transcription conversationnelle et la diarisation activées.

Pourquoi: La diarisation est la fonctionnalité spécifique qui segmente l'audio par locuteur, fournissant des informations "qui a dit quoi" en plus de la transcription.

Améliorer la précision de la reconnaissance vocale pour l'audio contenant des acronymes, du jargon ou des noms propres spécifiques au domaine.

Entraîner un modèle de reconnaissance vocale personnalisé. Fournir un jeu de données d'échantillons audio avec des transcriptions étiquetées par des humains correspondantes et un fichier de prononciation pour les termes personnalisés.

Pourquoi: Les modèles personnalisés adaptent les modèles acoustiques et linguistiques de base à votre environnement audio, vos styles de parole et votre vocabulaire spécifiques pour une précision significativement plus élevée.

Contrôler l'emphase, la hauteur, le débit et les pauses de la narration texte-parole pour un module d'apprentissage en ligne.

Utiliser le langage de balisage de synthèse vocale (SSML) dans la requête API de synthèse vocale.

Pourquoi: SSML est la norme W3C pour fournir des instructions détaillées à un synthétiseur vocal, permettant un contrôle granulaire au-delà de la simple saisie de texte.

Implémenter des solutions d'extraction de connaissances et d'intelligence documentaire

Concevoir une solution de recherche pour plus de 10 millions de documents nécessitant une faible latence pour un volume élevé de requêtes concurrentes.

Utiliser Azure AI Search sur un niveau Standard ou supérieur. Mettre à l'échelle avec des réplicas pour gérer la charge de requêtes et avec des partitions pour gérer le volume de données.

Pourquoi: Les réplicas sont pour le débit des requêtes (QPS). Les partitions sont pour la taille de l'index et les E/S. Les deux sont nécessaires pour les scénarios à grande échelle et à haute performance.

Permettre aux utilisateurs de poser des questions en langage naturel (par exemple, "Quelle est la politique de retour ?") et d'obtenir des réponses directes à partir d'une collection de documents.

Utiliser Azure AI Search avec la recherche sémantique activée. Utiliser les fonctionnalités de réponses et de légendes sémantiques.

Pourquoi: La recherche sémantique va au-delà de la correspondance de mots-clés pour comprendre l'intention de l'utilisateur et peut extraire et renvoyer des réponses directes et concises à partir du texte source.

Référence

Implémenter une recherche de produits qui trouve des correspondances exactes pour les numéros de modèle (mot-clé) et des articles conceptuellement similaires (sémantique).

Configurer un index Azure AI Search avec des champs de texte interrogeables et des champs vectoriels. Émettre des requêtes hybrides qui combinent les paramètres de mots-clés (`search`) et de vecteurs (`vectorQueries`).

Pourquoi: La recherche hybride combine la précision du classement par mots-clés BM25 avec la pertinence conceptuelle de la similarité vectorielle, offrant le meilleur des deux mondes.

Extraire des entités formatées personnalisées, comme les codes de produit (XX-####), pendant le pipeline d'indexation d'Azure AI Search.

Créer un ensemble de compétences personnalisé qui appelle une fonction Azure. La fonction contient l'expression régulière ou toute autre logique personnalisée pour trouver et extraire les entités.

Pourquoi: Les compétences personnalisées offrent un point d'extensibilité dans le pipeline d'enrichissement pour toute logique non couverte par les compétences cognitives intégrées.

S'assurer que les recherches pour "ordinateur portable", "notebook" et "ultrabook" renvoient toutes le même ensemble de documents pertinents.

Créer une carte de synonymes dans Azure AI Search définissant les termes équivalents. Associer la carte de synonymes aux champs interrogeables pertinents dans la définition de l'index.

Pourquoi: Les cartes de synonymes sont la fonctionnalité dédiée à l'extension des requêtes pour inclure des termes équivalents définis par l'utilisateur, améliorant directement le rappel de la recherche.

Lors de la mise à jour d'un ensemble de compétences Azure AI Search, ne retraiter que les documents affectés par les changements pour gagner du temps et réduire les coûts.

Activer la mise en cache de l'enrichissement dans la configuration de l'indexeur. L'indexeur utilisera alors les résultats mis en cache pour les compétences inchangées et ne réexécutera que les compétences nouvelles ou modifiées.

Pourquoi: La mise en cache des sorties de compétences intermédiaires est la clé pour permettre un enrichissement incrémentiel efficace, évitant un retraitement complet coûteux de l'ensemble du jeu de données.

Orchestrer un pipeline pour extraire des données de divers documents (par exemple, factures), les valider par rapport aux règles métier et stocker la sortie structurée.

Utiliser un modèle composé dans Azure AI Document Intelligence pour l'extraction, une fonction Azure pour la logique de validation personnalisée et Azure Cosmos DB pour le stockage. Orchestrer avec Azure Logic Apps.

Pourquoi: Cette architecture sans serveur sépare correctement les préoccupations : Document Intelligence pour l'extraction spécialisée, Functions pour la logique métier spécifique et Logic Apps pour l'orchestration des flux de travail.

Traiter un ensemble de documents contenant plusieurs types de formulaires (par exemple, un formulaire de réclamation, des reçus et des photos) en une seule transaction.

Utiliser un modèle composé Azure AI Document Intelligence. Entraîner un modèle de classification pour identifier le type de document et le router vers le modèle d'extraction personnalisé ou pré-construit approprié.

Pourquoi: Les modèles composés agissent comme un routeur, permettant à un point de terminaison unique de gérer intelligemment un mélange de types de documents, chacun traité par son modèle optimal.

Masquer les PII des documents avant qu'ils ne soient indexés par Azure AI Search, afin que les données sensibles ne soient jamais stockées dans l'index de recherche.

Ajouter la compétence cognitive PII Detection à l'ensemble de compétences de l'indexeur. Configurer la compétence pour masquer les PII et mapper le champ de texte masqué à l'index.

Pourquoi: Cela effectue le masquage "en vol" pendant l'indexation, garantissant que le contenu interrogeable est propre dès le départ, ce qui est un modèle de sécurité et de conformité essentiel.

Booster les résultats de recherche en fonction de la récence (date de publication) et de la popularité (nombre de vues) d'un document.

Définir un profil de notation personnalisé dans Azure AI Search. Utiliser une fonction `freshness` sur le champ de date et une fonction `magnitude` sur le champ de nombre de vues.

Pourquoi: Les profils de notation vous permettent de modifier le score de pertinence BM25 de base en incorporant des signaux spécifiques à l'entreprise provenant des métadonnées du document.

Implémenter des solutions d'IA générative

Un chatbot Azure OpenAI doit fournir des réponses cohérentes, ciblées et non créatives pour un scénario de service client.

Définir le paramètre `temperature` sur une valeur basse, telle que 0,1 ou 0,2. Éviter de le régler à exactement 0 pour la plupart des modèles.

Pourquoi: La température contrôle le caractère aléatoire de la sortie. La réduire rend le modèle plus déterministe et plus susceptible de choisir les jetons à plus haute probabilité.

Dans une solution RAG, s'assurer que le modèle génératif ne synthétise des réponses qu'à partir des documents auxquels l'utilisateur spécifique est autorisé à accéder.

Mettre en œuvre un filtrage de sécurité au stade de la récupération. Dans Azure AI Search, appliquer des filtres de sécurité à la requête de recherche basés sur l'identité AAD de l'utilisateur et ses appartenances à des groupes.

Pourquoi: Le contrôle d'accès doit être appliqué avant que le LLM ne voie les données. Le filtrage au niveau de la couche de recherche (récupération) est le seul moyen sécurisé d'implémenter cela.

Extraire systématiquement des données structurées de texte non structuré dans un objet JSON valide à l'aide d'Azure OpenAI.

Utiliser une invite qui inclut : 1) Un rôle clair. 2) Une instruction explicite de renvoyer UNIQUEMENT du JSON. 3) Le schéma JSON souhaité avec les noms de champs et les types. 4) Des exemples "few-shot" si possible.

Pourquoi: Des invites très structurées et explicites augmentent considérablement la fiabilité d'obtenir une sortie structurée et bien formée des LLM.

Une application critique nécessite un débit garanti et constant d'Azure OpenAI, sans étranglement pendant les périodes de pointe.

Acheter et déployer le modèle à l'aide d'Unités de Débit Provisionné (PTU).

Pourquoi: Les PTU fournissent une capacité de traitement de modèle dédiée et réservée, contrairement aux déploiements standard "paiement à l'utilisation" qui fonctionnent sur un modèle de capacité partagée et sont sujets à l'étranglement.

Référence

Maintenir le contexte dans une conversation de chatbot de longue durée sans dépasser la limite de jetons du modèle.

Mettre en œuvre une stratégie de résumé de conversation. Utiliser périodiquement un appel LLM distinct pour résumer les parties plus anciennes de la conversation, et inclure ce résumé ainsi que les tours les plus récents dans l'invite.

Pourquoi: Ce modèle de "résumé et glissement" préserve le contexte à long terme beaucoup plus efficacement et économiquement qu'une simple troncature ou l'envoi de l'historique entier (et éventuellement trop long).

Permettre à un modèle Azure OpenAI d'appeler une API externe pour obtenir des informations météorologiques actuelles.

Définir l'API comme un outil pour le modèle en utilisant un format JSON Schema précis. Inclure une `description` de fonction claire et des descriptions de `paramètres` détaillées afin que le modèle sache quand et comment l'utiliser.

Pourquoi: Le modèle s'appuie entièrement sur le schéma et les descriptions pour prendre une décision éclairée d'appeler une fonction. Une fonction bien décrite est essentielle pour la fiabilité.

Utiliser Azure OpenAI pour résumer un document beaucoup plus long que la fenêtre de contexte du modèle.

Mettre en œuvre une stratégie de "map-reduce" ou de "raffinage". Segmenter le document, générer un résumé pour chaque segment (map), puis générer un résumé final à partir de la collection de résumés de segments (reduce).

Pourquoi: Ceci est le modèle standard pour appliquer des modèles à contexte fixe à des entrées arbitrairement longues, garantissant que le contenu complet du document est pris en compte.

Améliorer la réactivité perçue d'une application de chat en affichant la réponse de l'IA au fur et à mesure qu'elle est générée.

Lors de l'appel de l'API Chat Completions, définir le paramètre `stream` sur `true`. Traiter les événements envoyés par le serveur au fur et à mesure de leur arrivée pour construire la réponse jeton par jeton.

Pourquoi: Le streaming offre une bien meilleure expérience utilisateur pour les applications en temps réel que d'attendre que la réponse complète soit générée, ce qui peut prendre plusieurs secondes.

Un agent d'IA doit décider dynamiquement lequel de plusieurs outils (par exemple, requête de base de données, recherche web, envoi d'e-mail) utiliser pour répondre à une demande d'utilisateur.

Utiliser un framework comme Semantic Kernel ou Azure AI Agent Service. Définir chaque capacité comme un outil/plugin distinct et laisser le planificateur de l'agent ou la boucle ReAct orchestrer les appels d'outils.

Pourquoi: Les frameworks agentiques fournissent la couche d'orchestration (planificateur/boucle de raisonnement) qui permet à un LLM de dépasser la simple question-réponse pour devenir un acteur autonome qui utilise des outils.

Empêcher un agent d'IA autonome d'effectuer des actions à haut risque (par exemple, suppression de données, dépenses d'argent) sans surveillance.

Mettre en œuvre un modèle "humain dans la boucle". Lorsque l'agent planifie une action à haut risque, le système doit se mettre en pause et exiger une confirmation explicite d'un opérateur humain avant l'exécution.

Pourquoi: Ceci est un modèle d'IA responsable essentiel pour les systèmes agentiques, équilibrant autonomie et sécurité en encadrant les actions irréversibles ou à fort impact.