Guia

Microsoft Azure AI Fundamentals

Última revisão: maio de 2026

Uma referência rápida dos padrões arquiteturais que o exame AI-900 avalia. Leia de cima a baixo ou pule para uma seção.

Descrever cargas de trabalho e considerações de IA

Um modelo de IA tem um desempenho insatisfatório para um grupo demográfico específico devido à sub-representação nos dados de treinamento.

Use o painel de IA Responsável do Azure Machine Learning para identificar e medir disparidades de justiça (por exemplo, paridade demográfica). Mitigue o viés através de aumento de dados, reamostragem ou usando algoritmos conscientes de justiça.

Por quê: A justiça exige tratamento equitativo em todos os grupos. A simples remoção de atributos protegidos é insuficiente, pois variáveis proxy ainda podem codificar viés.

Referência

Reguladores exigem uma explicação para cada decisão de negação de empréstimo impulsionada por IA.

Use técnicas de interpretabilidade e explicabilidade de modelo como SHAP (SHapley Additive exPlanations) através do painel de IA Responsável para gerar pontuações de importância de recursos para previsões individuais.

Por quê: Transparência é sobre tornar as decisões de IA compreensíveis. Métricas de precisão agregadas são insuficientes para explicar resultados individuais.

Um sistema de IA de alto risco (por exemplo, diagnóstico médico) precisa de supervisão humana antes que suas recomendações sejam executadas.

Implemente um fluxo de trabalho human-in-the-loop onde um humano qualificado revisa, aprova ou substitui as recomendações geradas por IA.

Por quê: A responsabilidade garante que os humanos são, em última instância, responsáveis pelos resultados do sistema de IA, especialmente em aplicações críticas.

Um chatbot com IA deve ser impedido de fornecer conselhos prejudiciais ou incorretos em domínios sensíveis como a saúde.

Implemente testes rigorosos, monitoramento de desempenho e filtragem de conteúdo. Estabeleça limites operacionais para evitar o uso em contextos não intencionais ou prejudiciais.

Por quê: Confiabilidade e Segurança exigem que os sistemas de IA operem de forma consistente e não causem danos.

Extraia insights pesquisáveis, entidades e relacionamentos de um grande corpus heterogêneo de documentos não estruturados (PDFs, DOCX, imagens).

Use o Azure AI Search. Crie um pipeline de enriquecimento que utiliza habilidades de IA (por exemplo, OCR, reconhecimento de entidades, detecção de idioma) para indexar conteúdo para pesquisa semântica.

Por quê: A mineração de conhecimento serve para criar um índice estruturado e pesquisável a partir de dados não estruturados, não apenas para processar documentos individuais.

Referência

Monitore dados de sensores em tempo real de equipamentos de fábrica para detectar padrões incomuns que indicam uma falha iminente.

Use o serviço Azure Anomaly Detector. Transmita dados de séries temporais para a API do serviço para identificar anomalias em tempo real.

Por quê: O Anomaly Detector é um serviço pré-construído otimizado para identificar padrões incomuns em dados de séries temporais sem exigir treinamento de modelo personalizado.

Um sistema de inspeção de qualidade com IA em uma fábrica exige tempos de inferência inferiores a 50ms e deve operar apesar da conectividade intermitente com a internet.

Implante um modelo de IA otimizado (por exemplo, formato ONNX) em um dispositivo de borda (como Azure IoT Edge) para inferência local.

Por quê: A IA de Borda atende aos requisitos de baixa latência e offline processando dados localmente, evitando viagens de rede de ida e volta para a nuvem.

Descrever princípios fundamentais de machine learning no Azure

Prever um valor numérico contínuo, como o preço de uma casa ou a receita de vendas futura.

Use um algoritmo de regressão (por exemplo, regressão linear, árvores impulsionadas). Avalie com métricas como Erro Quadrático Médio da Raiz (RMSE) ou Erro Absoluto Médio (MAE).

Por quê: A regressão é para perguntas "quanto?" ou "quantos?". Use a classificação para perguntas "qual categoria?".

Prever uma categoria discreta, como se uma transação é "fraudulenta" ou "legítima".

Use um algoritmo de classificação (por exemplo, regressão logística, random forest). Para duas categorias, use classificação binária. Para 3+, use classificação multi-classe. Avalie com uma matriz de confusão, precisão e recall.

Por quê: A classificação prevê um rótulo de um conjunto predefinido de categorias.

Descobrir agrupamentos naturais em um conjunto de dados de clientes para criar segmentos de marketing direcionados, sem categorias predefinidas.

Use um algoritmo de clustering não supervisionado como K-Means. Os dados não são rotulados.

Por quê: Clustering é uma técnica não supervisionada usada para encontrar estrutura em dados não rotulados. Use-a quando você não tem um alvo predefinido para prever.

Uma equipe com expertise limitada em ML precisa construir rapidamente um modelo testando automaticamente múltiplos algoritmos e hiperparâmetros.

Use o ML Automatizado (AutoML) no Azure Machine Learning. Especifique a tarefa (classificação, regressão) e deixe o AutoML iterar através dos modelos para encontrar o de melhor desempenho.

Por quê: O AutoML automatiza as tarefas demoradas de seleção de algoritmos e ajuste de hiperparâmetros, acelerando o desenvolvimento de modelos.

Referência

Um cientista de dados cidadão precisa construir um pipeline de ML usando uma interface visual, sem código, de arrastar e soltar.

Use o Azure Machine Learning designer. Conecte módulos pré-construídos para ingestão de dados, transformação, treinamento e pontuação em uma tela visual.

Por quê: O Designer é a solução no-code/low-code para construir pipelines de ML, distinta da abordagem de SDK code-first.

Um cientista de dados precisa de um ambiente de desenvolvimento interativo (Jupyter) e um recurso escalável e multi-nó para treinamento em lote.

Use uma instância de computação do Azure ML para desenvolvimento interativo. Use um cluster de computação do Azure ML para treinamento escalável e distribuído.

Por quê: Instâncias de computação são estações de trabalho de nó único para desenvolvimento. Clusters de computação são recursos multi-nó e de autoescalamento para treinamento de produção e inferência em lote.

Um modelo deve fornecer previsões instantâneas para um aplicativo web, enquanto outro precisa pontuar milhões de registros durante a noite.

Implante o modelo do aplicativo web em um endpoint online gerenciado em tempo real. Implante o modelo de pontuação em lote em um endpoint de lote.

Por quê: Endpoints online são para inferência síncrona de baixa latência. Endpoints em lote são para pontuação assíncrona de alto throughput de grandes conjuntos de dados.

Um modelo de detecção de fraude treinado com dados onde 99% das transações não são fraudulentas tem um desempenho ruim, perdendo a maioria dos casos de fraude reais.

Aborde o grave desequilíbrio de classes. As técnicas incluem superamostragem da classe minoritária (por exemplo, SMOTE), subamostragem da classe majoritária ou uso de funções de perda ponderadas por classe.

Por quê: Com dados desequilibrados, um modelo pode atingir alta precisão simplesmente prevendo a classe majoritária. Concentre-se em métricas como recall e precisão para a classe minoritária.

Descrever recursos de cargas de trabalho de visão computacional no Azure

Identificar múltiplos itens em uma esteira transportadora de armazém e fornecer a localização de cada item com uma caixa delimitadora.

Use um modelo de detecção de objetos. Esta tarefa retorna tanto um rótulo de classe quanto coordenadas para uma caixa delimitadora para cada objeto encontrado.

Por quê: A detecção de objetos responde "o que está nesta imagem e onde está?". A classificação de imagem apenas responde "o que está nesta imagem?".

Digitalizar atas manuscritas do conselho municipal a partir de imagens digitalizadas para torná-las pesquisáveis.

Use o serviço Azure AI Vision com a API Read (OCR). Ele suporta texto impresso e manuscrito.

Por quê: OCR (Reconhecimento Óptico de Caracteres) é a tarefa específica para extrair texto de imagens. A API Read é o motor de OCR mais avançado do Azure.

Identificar os limites exatos de um tumor em uma varredura de ressonância magnética, classificando cada pixel como "tumor" ou "tecido saudável".

Use segmentação de imagem. Esta técnica classifica cada pixel em uma imagem, fornecendo contornos precisos de objetos.

Por quê: A segmentação fornece detalhes em nível de pixel, o que é mais preciso do que as caixas delimitadoras da detecção de objetos.

Construir um modelo para classificar 50 tipos específicos de pratos de culinária usando apenas 75 imagens rotuladas por categoria.

Use o serviço Azure AI Custom Vision. Ele usa aprendizado por transferência para construir classificadores personalizados eficazes com pequenos conjuntos de dados.

Por quê: O Custom Vision é ideal para tarefas de classificação específicas de domínio quando você tem dados de treinamento limitados, evitando a necessidade de um modelo grande e de propósito geral.

Referência

Um sistema de segurança deve detectar uma pessoa, determinar sua idade aproximada e verificar se é uma pessoa real, não uma foto.

Use o serviço Azure AI Face. Use detecção facial para atributos (idade, óculos) e detecção de vivacidade para prevenir spoofing.

Por quê: O serviço Face oferece capacidades especializadas para detecção facial, análise de atributos, verificação, identificação e anti-spoofing que os serviços de visão gerais não possuem.

Extrair automaticamente dados estruturados (nome do fornecedor, número da fatura, itens de linha, total) de milhares de faturas em vários formatos.

Use o Azure AI Document Intelligence (anteriormente Form Recognizer) com seu modelo de fatura pré-construído.

Por quê: O Document Intelligence é construído especificamente para entender a estrutura de documentos e extrair pares chave-valor e tabelas, superando em muito o que um OCR simples pode fazer.

Analisar uma biblioteca de vídeos para criar automaticamente um índice pesquisável de palavras faladas, oradores identificados, texto visual e tópicos.

Use o Azure AI Video Indexer. Ele combina múltiplos modelos de IA (fala para texto, OCR, detecção facial, modelagem de tópicos) em um único serviço para análise profunda de vídeo.

Por quê: O Video Indexer é o serviço abrangente para extrair insights multimodais de conteúdo de vídeo, não apenas analisar quadros individuais.

Uma loja de varejo deseja analisar o fluxo de pessoas contando quantas pessoas entram em uma zona promocional específica em vídeo em tempo real.

Use a capacidade de Análise Espacial do Azure AI Vision. Configure zonas e eventos de cruzamento de linha para monitorar o movimento das pessoas.

Por quê: A análise espacial é projetada para entender o movimento de pessoas em espaços físicos usando feeds de vídeo, uma tarefa especializada além da detecção geral de objetos.

Descrever recursos de cargas de trabalho de Processamento de Linguagem Natural (NLP) no Azure

Um aplicativo precisa identificar e marcar automaticamente menções de empresas específicas, pessoas e locais em artigos de notícias.

Use o recurso de Reconhecimento de Entidades Nomeadas (NER) do serviço Azure AI Language.

Por quê: NER identifica e categoriza especificamente entidades conhecidas em tipos predefinidos. A Extração de Frases Chave encontra tópicos importantes, mas não os categoriza.

Analisar uma avaliação de produto para determinar não apenas o sentimento geral, mas também que a "vida útil da bateria" foi vista positivamente e a "tela" negativamente.

Use Análise de Sentimento com o recurso de mineração de opinião no serviço Azure AI Language.

Por quê: A mineração de opinião (sentimento baseado em aspecto) fornece insights granulares, ligando o sentimento a atributos específicos (alvos) dentro do texto.

Criar um chatbot que responde a perguntas de clientes usando os documentos de FAQ e manuais de produtos existentes da empresa como base de conhecimento.

Use o recurso de Respostas a Perguntas Personalizadas do Azure AI Language. Ingira os documentos para criar uma base de conhecimento que o serviço possa consultar.

Por quê: O recurso de Respostas a Perguntas é projetado para encontrar a melhor resposta a partir de um corpus de texto fornecido, o que é ideal para cenários de FAQ e bases de conhecimento.

Construir um assistente virtual que compreende intenções do usuário como "resetar senha" ou "reservar um voo" e extrai entidades relevantes (por exemplo, destino, data).

Use o Entendimento de Linguagem Conversacional (CLU) no Azure AI Language para construir um modelo personalizado que mapeia enunciados a intenções e entidades.

Por quê: O CLU é construído especificamente para entender a intenção conversacional em enunciados curtos, o que é diferente da análise de documentos longos.

Referência

Categorizar automaticamente e-mails de suporte recebidos em categorias predefinidas como "Faturamento", "Técnico" ou "Consulta de Conta".

Use o recurso de Classificação de Texto Personalizada do Azure AI Language. Treine um modelo com exemplos rotulados para cada categoria.

Por quê: Esta é uma tarefa clássica de classificação de documentos. A classificação personalizada permite definir suas próprias categorias específicas de negócios.

Um aplicativo habilitado para voz deve converter comandos falados em texto e, em seguida, gerar uma resposta falada com som natural.

Use o serviço Azure AI Speech. Use a API de fala para texto para transcrição e a API de texto para fala para síntese.

Por quê: O serviço Speech é o hub centralizado para todas as tarefas de IA relacionadas à fala, incluindo transcrição, síntese, tradução e reconhecimento de locutor.

Um sistema de segurança baseado em voz precisa verificar se uma pessoa que fala é quem ela afirma ser.

Use o recurso de Reconhecimento de Locutor do Azure AI Speech para realizar a verificação do locutor contra uma impressão de voz registrada.

Por quê: O reconhecimento de locutor identifica ou verifica uma pessoa por suas características vocais únicas, distinto de apenas transcrever o que ela diz.

Uma plataforma de e-commerce precisa traduzir descrições de produtos para 30 idiomas diferentes, preservando a formatação HTML.

Use o serviço Azure AI Translator. Ele suporta tradução de texto e documentos em mais de 100 idiomas e pode preservar a formatação.

Por quê: O Translator é o serviço dedicado e escalável para tradução multilíngue, mais otimizado para esta tarefa do que um modelo de linguagem de propósito geral.

Implantar um chatbot em múltiplos canais, incluindo um site da empresa, Microsoft Teams e Slack, a partir de uma única base de código.

Use o Azure Bot Service. Ele fornece uma estrutura e conectores de canal para gerenciar a comunicação em várias plataformas.

Por quê: O Bot Service lida com as complexidades de adaptar um núcleo de IA conversacional (como CLU ou QnA) aos protocolos específicos de diferentes plataformas de chat.

Descrever recursos de cargas de trabalho de IA generativa no Azure

Um chatbot deve responder a perguntas exclusivamente com base na base de conhecimento interna e frequentemente atualizada de uma empresa, e não em seu conhecimento geral pré-treinado.

Implemente o padrão de Geração Aumentada por Recuperação (RAG). Use o Azure AI Search para recuperar documentos relevantes e passá-los como contexto para um modelo Azure OpenAI para gerar uma resposta fundamentada.

Por quê: O RAG fundamenta o modelo em dados específicos e atuais sem retreinamento caro, reduzindo alucinações e garantindo a precisão factual a partir de uma fonte confiável.

Um desenvolvedor precisa que um modelo GPT responda em um formato específico (por exemplo, JSON).

Use few-shot prompting. Forneça 2-3 exemplos do formato de entrada-saída desejado diretamente no prompt antes da requisição real.

Por quê: O few-shot prompting guia o comportamento do modelo e a estrutura de saída através de exemplos em contexto, o que é mais rápido e mais barato do que o ajuste fino.

Melhorar a precisão de um modelo em um problema de raciocínio multi-etapa (por exemplo, um problema de matemática textual).

Use o prompting Chain-of-Thought (CoT) adicionando uma frase como "Pense passo a passo" ao prompt.

Por quê: O CoT encoraja o modelo a detalhar o problema e mostrar seu raciocínio, o que melhora significativamente o desempenho em tarefas lógicas complexas.

Controlar a criatividade versus previsibilidade da saída de texto de um modelo generativo.

Ajuste o parâmetro `temperature`. Um valor baixo (~0.1) torna a saída mais determinística e focada. Um valor alto (~0.9) a torna mais criativa e aleatória.

Por quê: A temperatura controla diretamente a aleatoriedade da seleção de tokens, permitindo que você ajuste o estilo de saída para o caso de uso específico (por exemplo, resumo factual vs. escrita criativa).

Uma empresa precisa usar os modelos GPT-4 e DALL-E da OpenAI em seu ambiente seguro do Azure, com rede privada e gerenciamento de identidade integrado.

Use o Serviço Azure OpenAI. Ele fornece modelos OpenAI com segurança de nível empresarial do Azure, conformidade, disponibilidade regional e filtragem de conteúdo.

Por quê: O Azure OpenAI fornece um invólucro seguro e pronto para empresas para modelos OpenAI, integrando-os ao ecossistema Azure.

Referência

Construir um sistema de busca que encontra documentos com base no significado semântico, não apenas na correspondência de palavras-chave (por exemplo, "manutenção de carro" encontra "intervalos de serviço de veículo").

Use um modelo de embeddings do Azure OpenAI (por exemplo, `text-embedding-ada-002`) para converter documentos e consultas em vetores numéricos. Use um banco de dados de vetores (como Azure AI Search) para encontrar os vetores mais próximos por similaridade de cosseno.

Por quê: Embeddings capturam o significado semântico do texto, permitindo buscas baseadas em similaridade conceitual em vez de sobreposição lexical.

Um aplicativo que usa Azure OpenAI deve automaticamente prevenir a geração de conteúdo relacionado a violência, discurso de ódio, conteúdo sexual ou automutilação.

Confie na filtragem de conteúdo integrada, impulsionada pelo Azure AI Content Safety. Configure os níveis de gravidade (baixo, médio, alto) para cada categoria de dano.

Por quê: O Azure OpenAI inclui um sistema de segurança obrigatório e multicamadas que filtra tanto prompts quanto conclusões para se alinhar aos princípios de IA responsável.

Uma equipe de marketing precisa gerar imagens personalizadas de produtos para campanhas publicitárias a partir de descrições de texto.

Use o modelo DALL-E disponível através do Azure OpenAI Service. Crie um prompt detalhado descrevendo a imagem desejada.

Por quê: DALL-E é um modelo de geração de texto para imagem, especificamente projetado para criar imagens novas a partir de prompts de linguagem natural.

Um assistente de IA generativa precisa acessar dados em tempo real (por exemplo, preços de ações atuais) ou executar ações (por exemplo, agendar uma reunião) chamando APIs externas.

Use a capacidade de chamada de função dos modelos Azure OpenAI. Defina as funções disponíveis na requisição da API; o modelo gerará um objeto JSON estruturado especificando qual função chamar com quais argumentos.

Por quê: A chamada de função permite que os LLMs interajam com ferramentas e APIs externas, superando a limitação de seus dados de treinamento estáticos e permitindo que eles tomem ações.

Uma equipe precisa construir, avaliar e implantar um aplicativo de IA generativa complexo orquestrando chamadas de LLM, scripts Python e modelos de prompt em um fluxo de trabalho visual.

Use o Azure AI Foundry (anteriormente AI Studio) e seu recurso Prompt flow. Construa o aplicativo como um grafo visual de ferramentas conectadas.

Por quê: O Prompt flow é a ferramenta de orquestração para construir e testar aplicativos complexos baseados em LLM, encadeando múltiplos componentes em um fluxo de trabalho reproduzível.

Uma equipe de TI precisa construir um copilot personalizado para uso interno que possa responder a perguntas de funcionários e se integrar a sistemas empresariais (por exemplo, ServiceNow, SAP) usando uma plataforma low-code.

Use o Microsoft Copilot Studio. Ele oferece uma interface gráfica low-code para construir copilots personalizados com conectores pré-construídos e capacidades de IA generativa.

Por quê: O Copilot Studio abstrai a complexidade da construção de assistentes de IA de nível empresarial, permitindo o desenvolvimento rápido sem codificação extensiva.