Você precisa de um único lugar para descobrir modelos, implementá-los e construir aplicações de IA no Azure.
→Use o portal Microsoft Foundry — ele hospeda o catálogo de modelos, implementações, playground e ferramentas de agent.
Por quê: Foundry é o hub unificado; serviços individuais do Azure AI existem, mas Foundry é onde você compõe e implementa soluções.
Referência↗
Você quer que o modelo sempre responda como um agent de suporte educado, independentemente da pergunta feita.
→Defina o comportamento e a persona no system prompt; coloque a pergunta específica no user prompt.
Por quê: O system prompt enquadra o comportamento e as regras gerais; o user prompt é o pedido por turno.
Referência↗
Você escolheu um modelo no catálogo e precisa que ele seja invocável a partir de uma aplicação.
→Crie uma implementação para o modelo no portal Foundry, que fornece um endpoint e uma chave.
Por quê: Um modelo no catálogo não é utilizável até ser implementado; a implementação expõe o endpoint invocável.
Referência↗
Você quer testar prompts e ajustar a temperature antes de escrever qualquer código.
→Use o chat playground no portal Foundry para interagir com o modelo implementado e ajustar os parâmetros.
Por quê: O playground permite iterar sobre prompts e configurações interativamente; não é necessário SDK para experimentar.
Você precisa chamar o modelo de chat implementado a partir do código da aplicação.
→Use o Foundry (Azure AI) SDK para criar um cliente de chat que envia mensagens para o endpoint da implementação.
Por quê: O SDK envolve o endpoint com um cliente tipado; você passa mensagens de sistema e de utilizador e lê a conclusão.
Referência↗
A sua aplicação deve autenticar-se no modelo implementado.
→Use o URL do endpoint da implementação com uma chave de API ou credencial Microsoft Entra ID (Azure AD).
Por quê: A autenticação baseada em chave é a mais simples; o Entra ID é mais seguro e evita incorporar segredos no código.
Você quer um assistente de IA que siga instruções e use ferramentas, construído sem muito código.
→Crie um único agent no portal Foundry — defina as suas instruções, modelo e ferramentas (o Serviço de Agente).
Por quê: O construtor de agent do portal configura o comportamento e as ferramentas de forma declarativa; você não escreve manualmente o loop de orquestração.
Referência↗
O seu agent deve sempre citar fontes e recusar pedidos fora do tópico.
→Codifique estas regras nas instruções do agent (a sua orientação de nível de sistema).
Por quê: As instruções do agent direcionam o comportamento consistente entre os turnos, semelhante a um system prompt para um modelo de chat simples.
O seu agent deve responder a partir dos documentos da sua empresa, não apenas dos seus dados de treino.
→Dê ao agent uma ferramenta de conhecimento/grounding (por exemplo, pesquisa de ficheiros ou Azure AI Search) para que ele recupere os seus dados.
Por quê: Grounding/RAG fornece contexto atual e privado; sem ele, o modelo pode alucinar ou usar conhecimento desatualizado.
Você precisa de uma aplicação personalizada para conduzir um agent Foundry programaticamente.
→Construa uma aplicação cliente de agent com o Foundry SDK — crie uma thread, adicione mensagens, execute o agent, leia as respostas.
Por quê: O SDK expõe threads, execuções e mensagens para que a sua aplicação possa integrar o agent em qualquer fluxo de trabalho.
Referência↗
Você deve construir uma aplicação que extraia sentimento e entidades de texto de entrada.
→Use Azure AI Language (análise de texto) via SDK ou REST, acedido através de Foundry, chamando recursos de sentimento e NER.
Por quê: Para tarefas clássicas de NLP, o serviço Language é construído para esse propósito e mais barato do que fazer um prompt a um LLM geral.
Referência↗
Um utilizador quer fazer uma pergunta falada e ter um modelo implementado a respondê-la.
→Envie o áudio para um modelo multimodal que aceita entrada de voz, ou transcreva primeiro e depois faça o prompt ao modelo.
Por quê: Modelos multimodais podem receber áudio diretamente; caso contrário, use speech-to-text para alimentar um modelo de texto.
A sua aplicação precisa de transcrição de alta qualidade e saída de voz natural.
→Use Azure AI Speech dentro de Foundry Tools para speech-to-text e text-to-speech.
Por quê: O serviço Speech oferece reconhecimento ajustado e vozes neurais realistas, além do que um modelo de chat sozinho proporciona.
Referência↗
Você precisa que a aplicação leia as respostas em voz alta com uma voz de som natural.
→Use Azure AI Speech text-to-speech com uma voz neural; controle a prosódia com SSML se necessário.
Por quê: Vozes neurais soam naturais; SSML permite ajustar o ritmo, tom e pronúncia.
Uma aplicação deve descrever o que está a acontecer numa foto fornecida pelo utilizador e responder a perguntas sobre ela.
→Envie a imagem para um modelo multimodal em Foundry e faça-lhe o prompt com a pergunta.
Por quê: LLMs multimodais raciocinam sobre o conteúdo da imagem; o serviço Vision clássico apenas retorna tags e legendas fixas.
Referência↗
Uma aplicação deve produzir imagens a partir de descrições de texto sob demanda.
→Implemente um modelo de texto para imagem (por exemplo, um modelo DALL-E / de geração de imagem) em Foundry e chame-o a partir da sua aplicação.
Por quê: Modelos de geração de imagem criam visuais a partir de prompts; um modelo de visão apenas analisa imagens existentes.
Referência↗
Você precisa de uma aplicação que classifique imagens e leia texto impresso delas.
→Construa uma aplicação de visão usando Azure AI Vision (análise de imagem e OCR) acedida através de Foundry.
Por quê: Azure AI Vision fornece análise de imagem e OCR prontos; você não precisa treinar um modelo para tarefas comuns.
Referência↗
Uma aplicação deve extrair texto impresso e manuscrito de páginas digitalizadas.
→Use a capacidade OCR (Leitura) de Azure AI Vision para retornar o texto reconhecido e a sua localização.
Por quê: OCR retorna texto bruto com coordenadas; a extração de campos estruturados precisa de Content Understanding em vez disso.
Você deve extrair campos estruturados (totais, datas, itens de linha) de faturas e formulários.
→Use Azure AI Content Understanding em Foundry Tools para extrair dados estruturados de documentos e formulários.
Por quê: Content Understanding extrai campos rotulados; o OCR simples apenas retorna texto não estruturado.
Referência↗
Você precisa de descrições estruturadas e metadados extraídos de um lote de imagens.
→Use Azure AI Content Understanding para analisar imagens e retornar saída estruturada.
Por quê: Content Understanding produz resultados estruturados consistentes em todos os tipos de conteúdo, além de uma legenda de texto livre.
Você deve transformar gravações de chamadas em resumos estruturados com pontos de dados chave.
→Use Azure AI Content Understanding no áudio para transcrever e extrair campos estruturados.
Por quê: Content Understanding combina transcrição com extração; Speech sozinho apenas fornece a transcrição.
Você precisa de cenas, tópicos e campos chave extraídos de vídeos de treino.
→Use Azure AI Content Understanding para vídeo para extrair insights estruturados em várias modalidades.
Por quê: Ele analisa streams de áudio e visual juntos para produzir saída estruturada, não apenas uma transcrição.
Referência↗
Você deve adicionar o conhecimento de FAQ privado da sua empresa às respostas do modelo, com esforço mínimo.
→Faça o grounding do modelo com recuperação (RAG) sobre os seus documentos, em vez de fine-tuning.
Por quê: RAG injeta dados atuais no momento da consulta e é mais simples/barato; fine-tuning altera o comportamento, não a frescura do conhecimento.
Você deve bloquear saídas de texto e imagem prejudiciais ou inseguras de um modelo implementado.
→Ative os filtros de Azure AI Content Safety na implementação para detetar e bloquear conteúdo prejudicial.
Por quê: Content Safety impõe guardrails de IA responsável em tempo de execução; o modelo base sozinho não é garantido como seguro.
Referência↗
Após a implementação, você precisa medir a qualidade da resposta e observar a deriva.
→Use as ferramentas de avaliação e monitorização do Foundry para pontuar saídas e monitorizar métricas ao longo do tempo.
Por quê: A avaliação quantifica a qualidade (groundedness, relevância); a monitorização deteta regressões em produção.
Você precisa organizar modelos, agents e conexões para uma aplicação.
→Crie um projeto Foundry, que agrupa implementações, recursos conectados e ferramentas para essa solução.
Por quê: Um projeto é o limite do espaço de trabalho; as conexões ligam recursos externos como Azure AI Search ou armazenamento.
Referência↗