Guia

Microsoft Azure AI Engineer Associate

Última revisão: maio de 2026

Uma referência rápida dos padrões arquiteturais que o exame AI-102 avalia. Leia de cima a baixo ou pule para uma seção.

Planejar, gerenciar e proteger uma solução de IA do Azure

Automatizar a rotação de chaves de API para um serviço de IA sem tempo de inatividade da aplicação.

Armazene as chaves primária e secundária no Azure Key Vault com rotação automática. Configure a aplicação para tentar a chave secundária se a primária falhar.

Por quê: O Key Vault gerencia o ciclo de vida da rotação. O padrão de chave dupla garante que uma chave esteja sempre válida durante a janela de rotação.

Garantir que o tráfego do serviço de IA nunca saia da VNet e que a Microsoft não possa usar dados do cliente para melhoria do serviço.

Implante o serviço de IA com um private endpoint e desative o acesso à rede pública. Separadamente, ative a configuração de opt-out de processamento de dados no recurso.

Por quê: Private Endpoint fornece isolamento de rede. A opção de opt-out de dados é uma configuração distinta para privacidade de dados. Uma não implica a outra.

Fornecer a uma aplicação no Azure Kubernetes Service (AKS) acesso seguro e sem credenciais a um serviço de IA.

Atribua uma managed identity atribuída pelo utilizador aos pods do AKS. Conceda a esta identidade a função RBAC de "Cognitive Services User" no recurso do serviço de IA.

Por quê: Managed identity é o padrão de autenticação sem palavra-passe para recursos do Azure, eliminando a necessidade de armazenar segredos nas configurações dos pods.

Referência

Monitorizar os custos do serviço de IA e aplicar limites de gastos por departamento sem usar subscrições separadas.

Crie recursos de serviço de IA separados por departamento. Aplique uma tag de recurso "departamento" a cada um. Configure orçamentos do Azure Cost Management com limites de alerta baseados no valor da tag.

Por quê: Tags são o padrão para alocação de custos. Os Orçamentos do Azure podem ser delimitados a tags para aplicar limites de gastos via alertas ou ações.

Alertar as operações quando as taxas de erro da API do serviço de IA excederem 5% ou a latência ultrapassar 2 segundos.

Configure alertas de métricas do Azure Monitor no recurso do serviço de IA. Utilize as métricas "Failed Requests" e "Latency" com um período de agregação apropriado.

Por quê: O Azure Monitor fornece métricas diretas de nível de plataforma para desempenho e confiabilidade, permitindo alertas em tempo real sem atrasos na consulta de logs.

Projetar um plano de recuperação de desastres para modelos de IA personalizados (por exemplo, Custom Vision, LUIS) com um baixo RTO/RPO.

Implante recursos em regiões emparelhadas. Automatize a exportação diária de modelos para armazenamento geo-redundante (GRS). Use o Azure Traffic Manager para failover automático baseado em health-probe.

Por quê: Os serviços de IA PaaS não são cobertos pelo Azure Site Recovery. A recuperação de desastres exige exportação/importação explícita e scriptada de modelos e um serviço de roteamento de tráfego de nível DNS.

Registrar payloads completos de solicitação e resposta para todas as chamadas de serviço de IA para retenção de auditoria de longo prazo.

Coloque o Azure API Management (APIM) na frente do serviço de IA. Configure as políticas do APIM para registrar corpos completos de solicitação/resposta. Envie logs para o Azure Storage com uma política de imutabilidade.

Por quê: Os diagnósticos nativos do serviço de IA não registram payloads completos. O APIM é o padrão para uma fachada de registro e política. O armazenamento imutável garante a integridade da trilha de auditoria.

Implementar uma solução de IA para saúde que processe dados de pacientes e deve estar em conformidade com a HIPAA.

Implante o recurso de IA em uma região do Azure nos EUA que suporte HIPAA. Assine um Business Associate Agreement (BAA) com a Microsoft para a subscrição.

Por quê: A conformidade com HIPAA exige controles técnicos (seleção de região) e acordos legais (BAA). Ambos são obrigatórios.

Implementar um sistema de moderação de conteúdo que sinaliza conteúdo prejudicial, mas permite revisão humana antes do bloqueio.

Utilize a API Azure AI Content Safety. Bloqueie automaticamente conteúdo sinalizado com severidade "alta". Envie conteúdo sinalizado como "médio" ou "baixo" para um fluxo de trabalho de revisão humana.

Por quê: Este padrão "human-in-the-loop" equilibra a segurança automatizada com a nuance necessária para a moderação, evitando o bloqueio excessivo de conteúdo legítimo.

Implementar soluções de processamento de imagem e vídeo

Detectar e contar produtos específicos de marca nas prateleiras de lojas de varejo, lidando com oclusão e orientação variável.

Treine um modelo de deteção de objetos Custom Vision. Utilize um dataset de imagens rotuladas que representem os produtos em ambientes de prateleira realistas.

Por quê: A deteção de objetos fornece classificação e localização (para contagem). Um modelo personalizado é necessário para reconhecer SKUs de produtos específicos.

Referência

Realizar análise de imagem para controlo de qualidade em tempo real numa fábrica com conectividade à internet não fiável.

Implante o container do Azure AI Vision para Análise de Imagem num dispositivo edge (por exemplo, Azure IoT Edge).

Por quê: Os containers empacotam modelos de IA da cloud para execução local, proporcionando baixa latência e capacidade offline, ao mesmo tempo que permitem atualizações de modelo quando conectados.

Extrair texto de documentos históricos digitalizados contendo impressão mista, texto manuscrito e vários idiomas.

Utilize a Azure AI Vision Read API (parte da Análise de Imagem). Especifique a versão mais recente do modelo para garantir o melhor desempenho em conteúdo misto.

Por quê: A Read API é o motor OCR mais avançado do Azure, otimizado especificamente para cenários centrados em documentos e conteúdo misto, superando APIs OCR mais antigas.

Analisar fluxos de vídeo para monitorizar a ocupação da loja, rastrear padrões de movimento de clientes e medir o comprimento das filas.

Implante o container Azure AI Vision Spatial Analysis num dispositivo edge conectado às câmaras da loja.

Por quê: Spatial Analysis é uma solução conteinerizada, desenvolvida especificamente para análises espaciais em tempo real a partir de vídeo, fornecendo operações como `personcount`, `persondistance` e `personcrossingline`.

Um modelo de deteção de objetos Custom Vision tem alta precisão, mas baixa recall (perde muitos objetos).

Aumente o dataset de treino com exemplos mais diversos dos objetos perdidos, particularmente imagens com diferentes iluminações, ângulos, tamanhos e oclusão parcial.

Por quê: Baixa recall é um problema de quantidade/diversidade de dados. O modelo não viu variações suficientes para generalizar eficazmente. Adicionar exemplos variados é a solução principal.

Implementar soluções de processamento de linguagem natural

Analisar avaliações de clientes para identificar o sentimento em relação a características específicas do produto (por exemplo, positivo para "duração da bateria", negativo para "ecrã").

Utilize a API Azure AI Language Sentiment Analysis com o parâmetro `opinionMining` ativado.

Por quê: Opinion Mining (também chamada de Análise de Sentimento Baseada em Aspectos) é a funcionalidade específica projetada para extrair o sentimento associado a alvos individuais (aspectos) dentro do texto.

Referência

Criar um bot de FAQ que suporte muitos idiomas, mas use uma única base de conhecimento escrita em inglês.

Utilize a funcionalidade Custom Question Answering do Azure AI Language. Possui tradução de consulta integrada para corresponder perguntas à base de conhecimento em inglês.

Por quê: A capacidade de tradução integrada elimina a necessidade de manter bases de conhecimento separadas para cada idioma, simplificando drasticamente a gestão de conteúdo.

Um modelo de Conversational Language Understanding (CLU) confunde duas intenções semelhantes (por exemplo, "PedirPizza" vs. "ModificarPedido").

Adicione mais enunciados de treino diversos a ambas as intenções, focando em exemplos que destaquem as palavras-chave e frases distintivas. Revise e remova exemplos ambíguos ou sobrepostos.

Por quê: A precisão do modelo é impulsionada principalmente pela qualidade e clareza dos dados de treino. O objetivo é criar um "limite de decisão" claro entre as intenções.

Extrair entidades específicas do domínio como "ValorDoContrato" ou "CláusulaDeRescisão" de documentos legais.

Treine um modelo Custom Named Entity Recognition (NER) usando o Azure AI Language. Forneça exemplos rotulados dos seus documentos.

Por quê: Os modelos NER pré-construídos só reconhecem entidades gerais (Pessoa, Local, etc.). O Custom NER é necessário para qualquer tarefa de extração de entidades específicas do domínio.

Localizar e redigir automaticamente Informações de Identificação Pessoal (PII) como nomes e números de telefone de um texto.

Utilize a API de deteção de PII do Azure AI Language. Configure as categorias de entidades a detetar e defina o modo de redação.

Por quê: Esta é uma API construída especificamente para PII, mais fiável e abrangente do que regex ou NER genérico para esta tarefa de conformidade específica.

Extrair entidades médicas, relações e afirmações (por exemplo, negação) de notas clínicas.

Utilize o Azure AI Health Insights, especificamente o serviço Text Analytics for Health.

Por quê: Este é um serviço especializado, compatível com HIPAA, treinado em ontologias médicas (por exemplo, UMLS), fornecendo uma compreensão profunda de texto clínico que os modelos de NLP gerais não possuem.

Traduzir documentos técnicos, garantindo que a terminologia específica da indústria e os nomes de marcas sejam traduzidos corretamente.

Utilize o Azure Custom Translator. Treine um modelo personalizado usando um corpus dos seus documentos traduzidos existentes (documentos paralelos).

Por quê: O Custom Translator adapta-se ao vocabulário e estilo do seu domínio específico, fornecendo maior fidelidade do que o modelo de tradução de propósito geral, que pode traduzir incorretamente termos de nicho.

Transcrever uma reunião com múltiplos participantes em tempo real e atribuir o texto a cada orador.

Utilize o serviço Azure AI Speech to Text com transcrição de conversas e diarização ativadas.

Por quê: Diarization é a funcionalidade específica que segmenta o áudio por orador, fornecendo informações de "quem disse o quê" juntamente com a transcrição.

Melhorar a precisão da conversão de fala em texto para áudio contendo acrónimos, jargão ou nomes próprios específicos do domínio.

Treine um modelo de fala personalizado. Forneça um dataset de amostras de áudio com transcrições rotuladas por humanos correspondentes e um ficheiro de pronúncia para termos personalizados.

Por quê: Os modelos personalizados adaptam os modelos acústicos e de linguagem base ao seu ambiente de áudio específico, estilos de fala e vocabulário para uma precisão significativamente maior.

Controlar a ênfase, o tom, a velocidade e as pausas da narração de texto para fala para um módulo de e-learning.

Utilize Speech Synthesis Markup Language (SSML) na solicitação da API Text-to-Speech.

Por quê: SSML é o padrão W3C para fornecer instruções detalhadas a um sintetizador de voz, permitindo um controlo granular além da entrada de texto simples.

Implementar soluções de mineração de conhecimento e inteligência de documentos

Projetar uma solução de pesquisa para mais de 10 milhões de documentos que exija baixa latência para um alto volume de consultas simultâneas.

Use o Azure AI Search em um nível Standard ou superior. Escale com réplicas para lidar com a carga de consulta e com partições para lidar com o volume de dados.

Por quê: Réplicas são para throughput de consulta (QPS). Partições são para tamanho do índice e I/O. Ambos são necessários para cenários de alta escala e alto desempenho.

Permitir que os utilizadores façam perguntas em linguagem natural (por exemplo, "Qual é a política de devolução?") e obtenham respostas diretas de uma coleção de documentos.

Utilize o Azure AI Search com semantic search ativada. Utilize as funcionalidades de respostas e legendas semânticas.

Por quê: A semantic search vai além da correspondência de palavras-chave para entender a intenção do utilizador e pode extrair e retornar respostas diretas e concisas do texto fonte.

Referência

Implementar uma pesquisa de produtos que encontre correspondências exatas para números de modelo (keyword) e itens conceitualmente semelhantes (semântica).

Configure um índice Azure AI Search com campos de texto pesquisáveis e campos vetoriais. Emita consultas híbridas que combinam parâmetros de palavra-chave (`search`) e vetoriais (`vectorQueries`).

Por quê: A pesquisa híbrida combina a precisão do ranking de palavras-chave BM25 com a relevância conceptual da similaridade vetorial, proporcionando o melhor de dois mundos.

Extrair entidades com formato personalizado, como códigos de produto (XX-####), durante o pipeline de indexação do Azure AI Search.

Crie um custom skillset que chama uma Azure Function. A função contém a regex ou outra lógica personalizada para encontrar e extrair as entidades.

Por quê: As custom skills fornecem um ponto de extensibilidade no pipeline de enriquecimento para qualquer lógica não coberta pelas cognitive skills incorporadas.

Garantir que as pesquisas por "laptop", "notebook" e "ultrabook" retornem o mesmo conjunto de documentos relevantes.

Crie um mapa de sinónimos no Azure AI Search definindo os termos equivalentes. Associe o mapa de sinónimos aos campos pesquisáveis relevantes na definição do índice.

Por quê: Os mapas de sinónimos são a funcionalidade dedicada para expandir as consultas para incluir termos equivalentes definidos pelo utilizador, melhorando diretamente o recall da pesquisa.

Ao atualizar um skillset do Azure AI Search, reprocessar apenas os documentos afetados pelas alterações para economizar tempo e custo.

Ative o cache de enriquecimento na configuração do indexador. O indexador usará então resultados em cache para skills inalteradas e só executará novamente skills novas ou modificadas.

Por quê: O cache de saídas de skills intermediárias é a chave para permitir um enriquecimento incremental eficiente, evitando o reprocessamento completo e dispendioso de todo o dataset.

Orquestrar um pipeline para extrair dados de vários documentos (por exemplo, faturas), validá-los contra regras de negócio e armazenar a saída estruturada.

Utilize um composed model no Azure AI Document Intelligence para extração, uma Azure Function para lógica de validação personalizada e o Azure Cosmos DB para armazenamento. Orquestre com o Azure Logic Apps.

Por quê: Esta arquitetura serverless separa corretamente as preocupações: Document Intelligence para extração especializada, Functions para lógica de negócio personalizada e Logic Apps para orquestração de fluxo de trabalho.

Processar um pacote de documentos contendo vários tipos de formulários (por exemplo, um formulário de reclamação, recibos e fotos) em uma única transação.

Utilize um Azure AI Document Intelligence composed model. Treine um modelo de classificação para identificar o tipo de documento e encaminhá-lo para o modelo de extração personalizado ou pré-construído apropriado.

Por quê: Os composed models atuam como um roteador, permitindo que um único endpoint lide inteligentemente com uma mistura de tipos de documentos, cada um processado pelo seu modelo ideal.

Redigir PII de documentos antes de serem indexados pelo Azure AI Search, para que dados sensíveis nunca sejam armazenados no índice de pesquisa.

Adicione a cognitive skill de deteção de PII ao skillset do indexador. Configure a skill para mascarar PII e mapeie o campo de texto redigido para o índice.

Por quê: Isso executa a redação "em tempo real" durante a indexação, garantindo que o conteúdo pesquisável esteja limpo desde o início, o que é um padrão crítico de segurança e conformidade.

Aumentar a classificação dos resultados de pesquisa com base na recenticidade (data de publicação) e popularidade (contagem de visualizações) de um documento.

Defina um custom scoring profile no Azure AI Search. Use uma função `freshness` no campo de data e uma função `magnitude` no campo de contagem de visualizações.

Por quê: Os scoring profiles permitem modificar a pontuação de relevância base BM25 incorporando sinais específicos do negócio a partir de metadados do documento.

Implementar soluções de IA generativa

Um chatbot Azure OpenAI precisa fornecer respostas consistentes, focadas e não criativas para um cenário de atendimento ao cliente.

Defina o parâmetro `temperature` para um valor baixo, como 0.1 ou 0.2. Evite defini-lo para exatamente 0 para a maioria dos modelos.

Por quê: A temperature controla a aleatoriedade da saída. Diminuí-la torna o modelo mais determinístico e propenso a escolher os tokens de maior probabilidade.

Numa solução RAG, garanta que o modelo generativo sintetize respostas apenas a partir de documentos que o utilizador específico tem permissão para aceder.

Implemente o corte de segurança na fase de recuperação. No Azure AI Search, aplique filtros de segurança à consulta de pesquisa com base na identidade AAD e nas associações de grupo do utilizador.

Por quê: O controlo de acesso deve ser imposto antes que o LLM veja os dados. Filtrar na camada de pesquisa (recuperação) é a única forma segura de implementar isso.

Extrair consistentemente dados estruturados de texto não estruturado para um objeto JSON válido usando o Azure OpenAI.

Utilize um prompt que inclua: 1) Uma função clara. 2) Instrução explícita para retornar APENAS JSON. 3) O esquema JSON desejado com nomes e tipos de campos. 4) Exemplos few-shot, se possível.

Por quê: Prompts altamente estruturados e explícitos aumentam significativamente a fiabilidade de obter saída estruturada e bem formada de LLMs.

Uma aplicação de missão crítica exige throughput garantido e consistente do Azure OpenAI, sem throttling durante picos de carga.

Adquira e implante o modelo usando Provisioned Throughput Units (PTU).

Por quê: PTUs fornecem capacidade de processamento de modelo dedicada e reservada, ao contrário das implantações padrão pay-as-you-go, que operam em um modelo de capacidade partilhada e estão sujeitas a throttling.

Referência

Manter o contexto numa conversa de chatbot de longa duração sem exceder o limite de tokens do modelo.

Implementar uma estratégia de sumarização de conversas. Periodicamente, use uma chamada LLM separada para resumir partes mais antigas da conversa e inclua este resumo, mais as últimas interações, no prompt.

Por quê: Este padrão "sumarizar e deslizar" preserva o contexto a longo prazo de forma muito mais eficaz e económica do que uma simples truncagem ou o envio de todo o histórico (e eventualmente demasiado longo).

Permitir que um modelo Azure OpenAI chame uma API externa para obter informações meteorológicas atuais.

Defina a API como uma ferramenta para o modelo usando um formato JSON Schema preciso. Inclua uma `description` de função clara e descrições `parameter` detalhadas para que o modelo saiba quando e como usá-la.

Por quê: O modelo depende inteiramente do esquema e das descrições para tomar uma decisão informada sobre a chamada de uma função. Uma função bem descrita é crítica para a fiabilidade.

Utilizar o Azure OpenAI para resumir um documento que é muito mais longo do que a janela de contexto do modelo.

Implementar uma estratégia de "map-reduce" ou "refinamento". Divida o documento em blocos, gere um resumo para cada bloco (map), e depois gere um resumo final a partir da coleção de resumos dos blocos (reduce).

Por quê: Este é o padrão standard para aplicar modelos de contexto fixo a entradas arbitrariamente longas, garantindo que todo o conteúdo do documento é considerado.

Melhorar a responsividade percebida de uma aplicação de chat exibindo a resposta da IA à medida que está a ser gerada.

Ao chamar a Chat Completions API, defina o parâmetro `stream` como `true`. Processe os eventos enviados pelo servidor à medida que chegam para construir a resposta token a token.

Por quê: O streaming proporciona uma experiência de utilizador muito melhor para aplicações em tempo real do que esperar que a resposta completa seja gerada, o que pode levar vários segundos.

Um agente de IA deve decidir dinamicamente qual das várias ferramentas (por exemplo, consulta de base de dados, pesquisa web, remetente de e-mail) usar para satisfazer um pedido do utilizador.

Utilize um framework como Semantic Kernel ou Azure AI Agent Service. Defina cada capacidade como uma ferramenta/plugin distinto e deixe o planner ou o loop ReAct do agente orquestrar as chamadas de ferramentas.

Por quê: Os frameworks agentic fornecem a camada de orquestração (planner/loop de raciocínio) que permite a um LLM ir além de simples perguntas e respostas para se tornar um ator autónomo que utiliza ferramentas.

Impedir que um agente de IA autónomo execute ações de alto risco (por exemplo, apagar dados, gastar dinheiro) sem supervisão.

Implementar um padrão human-in-the-loop. Quando o agente planeia uma ação de alto risco, o sistema deve pausar e exigir confirmação explícita de um operador humano antes de executar.

Por quê: Este é um padrão crítico de IA responsável para sistemas agentic, equilibrando autonomia com segurança ao controlar ações irreversíveis ou de alto impacto.