Guia — AI-901 Microsoft Azure AI Fundamentals

Última revisão: junho de 2026

Uma referência rápida dos padrões arquiteturais que o exame AI-901 avalia. Leia de cima a baixo ou pule para uma seção.

Identificar conceitos e capacidades de IA

Um modelo de aprovação de empréstimos não deve desfavorecer pessoas com base em género ou etnia.

Aplicar o princípio de IA Responsável da imparcialidade: avaliar e mitigar o preconceito entre grupos demográficos.

Por quê: A imparcialidade visa o tratamento equitativo; não a confunda com fiabilidade (resultados consistentes) ou privacidade (proteção de dados).

Referência

Um modelo de condução autónoma deve comportar-se de forma consistente e falhar com segurança em condições inesperadas.

Aplicar fiabilidade e segurança: testes rigorosos, monitorização e barreiras de proteção para casos extremos.

Por quê: Fiabilidade e segurança são sobre comportamento consistente e que evita danos em condições de incerteza, não sobre a quem os dados se referem.

Uma aplicação de saúde processa dados pessoais e deve protegê-los contra exposição ou uso indevido.

Aplicar privacidade e segurança: proteger dados pessoais, controlar o acesso e respeitar o consentimento.

Por quê: Este princípio abrange a confidencialidade e proteção de dados; a imparcialidade e a inclusão são sobre a quem o sistema serve.

Uma solução deve capacitar e envolver as pessoas independentemente da sua capacidade ou origem.

Aplicar inclusão: conceber de modo a que todos beneficiem, incluindo pessoas com deficiência.

Por quê: A inclusão é sobre acessibilidade e alcance amplos; a imparcialidade é especificamente sobre resultados imparciais.

Os utilizadores devem compreender como um sistema de IA toma as suas decisões e quais são os seus limites.

Aplicar transparência: explicar como o sistema funciona, o seu propósito, capacidades e limitações.

Por quê: A transparência torna o sistema compreensível; a responsabilidade é sobre quem é responsável por ele.

É necessária uma propriedade e governação claras para que alguém responda pelo comportamento de um sistema de IA.

Aplicar responsabilidade: as pessoas concebem, constroem e operam dentro de um quadro de governação e permanecem responsáveis.

Por quê: A responsabilidade atribui responsabilidade humana; a transparência apenas explica o sistema, não atribui propriedade.

Explicar como um modelo de IA generativa produz um parágrafo coerente a partir de um prompt.

Um large language model prevê o próximo token repetidamente usando padrões aprendidos a partir de textos massivos de treino.

Por quê: Os modelos generativos geram novo conteúdo via previsão probabilística de tokens; eles não recuperam respostas armazenadas palavra por palavra.

Referência

Escolha um modelo: um precisa de chat de alto volume e barato, outro precisa de raciocínio complexo de várias etapas.

Combine o modelo com a tarefa — um modelo menor/mais rápido para chat rotineiro, um modelo de raciocínio maior para tarefas difíceis.

Por quê: Maior nem sempre é melhor; capacidade, custo e latência são compensações, então escolha de acordo com a necessidade da workload.

Referência

Decida como consumir um modelo: endpoint padrão gerido vs. capacidade dedicada.

Use uma implementação padrão (pay-as-you-go) para carga variável, ou throughput provisionado para alto volume estável e desempenho previsível.

Por quê: O provisionamento reserva capacidade para latência consistente; o padrão fatura por token e é o mais simples para começar.

Referência

A saída é muito repetitiva; você quer respostas mais criativas e variadas.

Aumente o parâmetro temperature; diminua-o para 0 para uma saída determinística e focada.

Por quê: Temperature controla a aleatoriedade da seleção de tokens; alto = criativo, baixo = consistente.

As respostas são cortadas a meio da frase, ou você precisa limitar o comprimento e o custo da saída.

Ajuste o parâmetro max tokens (comprimento máximo de conclusão) para definir o limite da resposta.

Por quê: Max tokens limita o comprimento da saída; não altera a criatividade — isso é temperature ou top-p.

Você quer limitar as escolhas de tokens ao conjunto mais provável sem uma temperature rígida.

Use top-p (amostragem de núcleo) para restringir a amostragem ao menor conjunto de tokens cujas probabilidades somam p.

Por quê: Top-p estreita o conjunto de candidatos pela massa de probabilidade; ajuste-o ou temperature, geralmente não ambos agressivamente.

Uma workload deve redigir textos de marketing e resumos a partir de prompts.

Esta é uma workload de IA generativa — criação de conteúdo a partir de instruções em linguagem natural.

Por quê: Workloads generativas produzem novo conteúdo; a análise de texto apenas extrai insights de texto existente.

Um sistema deve planear passos, chamar ferramentas e agir em direção a um objetivo com supervisão mínima.

Esta é uma workload de IA agentic — um LLM-driven agent que raciocina, usa ferramentas e toma ações.

Por quê: Agentic adiciona autonomia e uso de ferramentas além da geração; a IA generativa simples apenas retorna conteúdo.

Uma workload extrai de avaliações de clientes o sentimento, frases-chave e entidades nomeadas.

Esta é uma workload de análise de texto (NLP).

Por quê: A análise de texto interpreta texto existente; não gera nova prosa como uma workload generativa.

Referência

Uma workload deve transcrever chamadas e ler respostas em voz alta.

Esta é uma workload de voz — reconhecimento de fala para texto e síntese de texto para fala.

Por quê: Voz cobre entrada/saída de áudio; visão computacional lida com imagens, não áudio.

Uma workload deve detetar objetos e ler texto de fotografias.

Esta é uma workload de visão computacional — classificação de imagem, deteção de objetos e OCR.

Por quê: A visão computacional interpreta imagens; a extração de informações de documentos é uma tarefa relacionada, mas distinta.

Uma workload deve extrair campos como datas, totais e fornecedor de faturas digitalizadas.

Esta é uma workload de extração de informação / dados (compreensão de documentos).

Por quê: A extração obtém campos estruturados de documentos; o OCR genérico apenas retorna texto bruto, não campos rotulados.

Você precisa dos tópicos principais de um bloco de texto sem o ler na íntegra.

Use a extração de frases-chave (palavras-chave) para identificar os termos mais importantes.

Por quê: A extração de frases-chave lista termos salientes; a deteção de entidades, em vez disso, classifica coisas nomeadas como pessoas ou lugares.

Você deve identificar pessoas, organizações, locais e datas mencionados no texto.

Use o reconhecimento de entidades nomeadas (deteção de entidades) para classificar essas entidades.

Por quê: A deteção de entidades rotula coisas nomeadas; a análise de sentimento, em vez disso, pontua o tom emocional.

Você quer saber se as avaliações são positivas, negativas ou neutras.

Use a análise de sentimento para pontuar a opinião expressa no texto.

Por quê: O sentimento mede o tom; o resumo condensa o conteúdo, não julga a polaridade.

Você precisa de um resumo curto de um relatório longo.

Use a sumarização de texto (extrativa ou abstrativa) para condensar o documento.

Por quê: A sumarização encurta preservando o significado; a extração de frases-chave apenas lista termos, não um resumo legível.

Distinguir a conversão de áudio para texto da conversão de texto para áudio.

O reconhecimento de fala (speech-to-text) transcreve áudio; a síntese de fala (text-to-speech) gera áudio falado.

Por quê: O reconhecimento é áudio de entrada→texto; a síntese é o inverso — não troque as duas direções.

Referência

Implementar soluções de IA usando Microsoft Foundry

Você precisa de um único lugar para descobrir modelos, implementá-los e construir aplicações de IA no Azure.

Use o portal Microsoft Foundry — ele hospeda o catálogo de modelos, implementações, playground e ferramentas de agent.

Por quê: Foundry é o hub unificado; serviços individuais do Azure AI existem, mas Foundry é onde você compõe e implementa soluções.

Referência

Você quer que o modelo sempre responda como um agent de suporte educado, independentemente da pergunta feita.

Defina o comportamento e a persona no system prompt; coloque a pergunta específica no user prompt.

Por quê: O system prompt enquadra o comportamento e as regras gerais; o user prompt é o pedido por turno.

Referência

Você escolheu um modelo no catálogo e precisa que ele seja invocável a partir de uma aplicação.

Crie uma implementação para o modelo no portal Foundry, que fornece um endpoint e uma chave.

Por quê: Um modelo no catálogo não é utilizável até ser implementado; a implementação expõe o endpoint invocável.

Referência

Você quer testar prompts e ajustar a temperature antes de escrever qualquer código.

Use o chat playground no portal Foundry para interagir com o modelo implementado e ajustar os parâmetros.

Por quê: O playground permite iterar sobre prompts e configurações interativamente; não é necessário SDK para experimentar.

Você precisa chamar o modelo de chat implementado a partir do código da aplicação.

Use o Foundry (Azure AI) SDK para criar um cliente de chat que envia mensagens para o endpoint da implementação.

Por quê: O SDK envolve o endpoint com um cliente tipado; você passa mensagens de sistema e de utilizador e lê a conclusão.

Referência

A sua aplicação deve autenticar-se no modelo implementado.

Use o URL do endpoint da implementação com uma chave de API ou credencial Microsoft Entra ID (Azure AD).

Por quê: A autenticação baseada em chave é a mais simples; o Entra ID é mais seguro e evita incorporar segredos no código.

Você quer um assistente de IA que siga instruções e use ferramentas, construído sem muito código.

Crie um único agent no portal Foundry — defina as suas instruções, modelo e ferramentas (o Serviço de Agente).

Por quê: O construtor de agent do portal configura o comportamento e as ferramentas de forma declarativa; você não escreve manualmente o loop de orquestração.

Referência

O seu agent deve sempre citar fontes e recusar pedidos fora do tópico.

Codifique estas regras nas instruções do agent (a sua orientação de nível de sistema).

Por quê: As instruções do agent direcionam o comportamento consistente entre os turnos, semelhante a um system prompt para um modelo de chat simples.

O seu agent deve responder a partir dos documentos da sua empresa, não apenas dos seus dados de treino.

Dê ao agent uma ferramenta de conhecimento/grounding (por exemplo, pesquisa de ficheiros ou Azure AI Search) para que ele recupere os seus dados.

Por quê: Grounding/RAG fornece contexto atual e privado; sem ele, o modelo pode alucinar ou usar conhecimento desatualizado.

Você precisa de uma aplicação personalizada para conduzir um agent Foundry programaticamente.

Construa uma aplicação cliente de agent com o Foundry SDK — crie uma thread, adicione mensagens, execute o agent, leia as respostas.

Por quê: O SDK expõe threads, execuções e mensagens para que a sua aplicação possa integrar o agent em qualquer fluxo de trabalho.

Referência

Você deve construir uma aplicação que extraia sentimento e entidades de texto de entrada.

Use Azure AI Language (análise de texto) via SDK ou REST, acedido através de Foundry, chamando recursos de sentimento e NER.

Por quê: Para tarefas clássicas de NLP, o serviço Language é construído para esse propósito e mais barato do que fazer um prompt a um LLM geral.

Referência

Um utilizador quer fazer uma pergunta falada e ter um modelo implementado a respondê-la.

Envie o áudio para um modelo multimodal que aceita entrada de voz, ou transcreva primeiro e depois faça o prompt ao modelo.

Por quê: Modelos multimodais podem receber áudio diretamente; caso contrário, use speech-to-text para alimentar um modelo de texto.

A sua aplicação precisa de transcrição de alta qualidade e saída de voz natural.

Use Azure AI Speech dentro de Foundry Tools para speech-to-text e text-to-speech.

Por quê: O serviço Speech oferece reconhecimento ajustado e vozes neurais realistas, além do que um modelo de chat sozinho proporciona.

Referência

Você precisa que a aplicação leia as respostas em voz alta com uma voz de som natural.

Use Azure AI Speech text-to-speech com uma voz neural; controle a prosódia com SSML se necessário.

Por quê: Vozes neurais soam naturais; SSML permite ajustar o ritmo, tom e pronúncia.

Uma aplicação deve descrever o que está a acontecer numa foto fornecida pelo utilizador e responder a perguntas sobre ela.

Envie a imagem para um modelo multimodal em Foundry e faça-lhe o prompt com a pergunta.

Por quê: LLMs multimodais raciocinam sobre o conteúdo da imagem; o serviço Vision clássico apenas retorna tags e legendas fixas.

Referência

Uma aplicação deve produzir imagens a partir de descrições de texto sob demanda.

Implemente um modelo de texto para imagem (por exemplo, um modelo DALL-E / de geração de imagem) em Foundry e chame-o a partir da sua aplicação.

Por quê: Modelos de geração de imagem criam visuais a partir de prompts; um modelo de visão apenas analisa imagens existentes.

Referência

Você precisa de uma aplicação que classifique imagens e leia texto impresso delas.

Construa uma aplicação de visão usando Azure AI Vision (análise de imagem e OCR) acedida através de Foundry.

Por quê: Azure AI Vision fornece análise de imagem e OCR prontos; você não precisa treinar um modelo para tarefas comuns.

Referência

Uma aplicação deve extrair texto impresso e manuscrito de páginas digitalizadas.

Use a capacidade OCR (Leitura) de Azure AI Vision para retornar o texto reconhecido e a sua localização.

Por quê: OCR retorna texto bruto com coordenadas; a extração de campos estruturados precisa de Content Understanding em vez disso.

Você deve extrair campos estruturados (totais, datas, itens de linha) de faturas e formulários.

Use Azure AI Content Understanding em Foundry Tools para extrair dados estruturados de documentos e formulários.

Por quê: Content Understanding extrai campos rotulados; o OCR simples apenas retorna texto não estruturado.

Referência

Você precisa de descrições estruturadas e metadados extraídos de um lote de imagens.

Use Azure AI Content Understanding para analisar imagens e retornar saída estruturada.

Por quê: Content Understanding produz resultados estruturados consistentes em todos os tipos de conteúdo, além de uma legenda de texto livre.

Você deve transformar gravações de chamadas em resumos estruturados com pontos de dados chave.

Use Azure AI Content Understanding no áudio para transcrever e extrair campos estruturados.

Por quê: Content Understanding combina transcrição com extração; Speech sozinho apenas fornece a transcrição.

Você precisa de cenas, tópicos e campos chave extraídos de vídeos de treino.

Use Azure AI Content Understanding para vídeo para extrair insights estruturados em várias modalidades.

Por quê: Ele analisa streams de áudio e visual juntos para produzir saída estruturada, não apenas uma transcrição.

Referência

Você deve adicionar o conhecimento de FAQ privado da sua empresa às respostas do modelo, com esforço mínimo.

Faça o grounding do modelo com recuperação (RAG) sobre os seus documentos, em vez de fine-tuning.

Por quê: RAG injeta dados atuais no momento da consulta e é mais simples/barato; fine-tuning altera o comportamento, não a frescura do conhecimento.

Você deve bloquear saídas de texto e imagem prejudiciais ou inseguras de um modelo implementado.

Ative os filtros de Azure AI Content Safety na implementação para detetar e bloquear conteúdo prejudicial.

Por quê: Content Safety impõe guardrails de IA responsável em tempo de execução; o modelo base sozinho não é garantido como seguro.

Referência

Após a implementação, você precisa medir a qualidade da resposta e observar a deriva.

Use as ferramentas de avaliação e monitorização do Foundry para pontuar saídas e monitorizar métricas ao longo do tempo.

Por quê: A avaliação quantifica a qualidade (groundedness, relevância); a monitorização deteta regressões em produção.

Você precisa organizar modelos, agents e conexões para uma aplicação.

Crie um projeto Foundry, que agrupa implementações, recursos conectados e ferramentas para essa solução.

Por quê: Um projeto é o limite do espaço de trabalho; as conexões ligam recursos externos como Azure AI Search ou armazenamento.