Guia

AWS Certified AI Practitioner

Última revisão: abril de 2026

Uma referência rápida dos padrões arquiteturais que o exame AIF-C01 avalia. Leia de cima a baixo ou pule para uma seção.

Fundamentos de IA e ML

Escolha um paradigma de aprendizado: dados rotulados, dados não rotulados ou tentativa e erro interativa.

Rotulados → supervisionado. Clustering/segmentação não rotulada → não supervisionado. Agente aprende por recompensa → reforço.

Por quê: A escolha é ditada pelos dados existentes. RLHF é aprendizado por reforço guiado por avaliações humanas, usado para alinhar LLMs.

Referência

Adapte um modelo pré-treinado a uma nova tarefa relacionada em vez de treinar do zero.

Use transfer learning. Faça fine-tuning do modelo existente no novo conjunto de dados do domínio.

Por quê: Reaproveita representações aprendidas, reduz o tempo de treinamento e a necessidade de dados em comparação com a construção de um modelo do zero.

Escolha um modo de inferência do SageMaker para o formato da carga de trabalho.

Latência baixa e estável → tempo real. Tráfego em picos/ocioso → serverless. Carga útil grande (≤1 GB) ou trabalho longo (≤1 h) com quase tempo real → assíncrono. Bulk offline → batch transform.

Por quê: Tempo real tem limites de carga útil/tempo limite; assíncrono enfileira trabalhos grandes; batch é para pontuação offline periódica.

Referência

Múltiplas equipes de ML precisam compartilhar e reutilizar recursos projetados.

Amazon SageMaker Feature Store como o repositório central para recursos online + offline.

Por quê: Evita a engenharia de recursos duplicada e mantém a consistência de treinamento/serviço entre as equipes.

Referência

Construa modelos de ML sem codificação ou experiência em ML (por exemplo, previsão de demanda para analistas).

Amazon SageMaker Canvas — interface visual sem código para treinamento e inferência.

Referência

Implante um modelo de fundação rapidamente dentro de uma VPC.

Amazon SageMaker JumpStart — modelos pré-treinados são implantados como endpoints do SageMaker em sua VPC.

Por quê: O JumpStart agrupa artefatos de modelo e notebooks para implantação em VPC com um clique.

Referência

Automatize o ajuste de hiperparâmetros e a seleção de modelos.

Amazon SageMaker Autopilot — explora algoritmos e ajusta hiperparâmetros automaticamente.

Referência

Escolha a métrica de avaliação correta para um modelo de classificação.

Corretude da classificação de imagem/binária → acurácia. Detalhamento de classes → matriz de confusão. Classes desbalanceadas → F1, precisão, recall. Independente de limiar → AUC.

Por quê: A acurácia engana em dados desbalanceados; a matriz de confusão mostra contagens de TP/FP/TN/FN; F1 equilibra precisão e recall.

O custo de perder um positivo (falso negativo) é muito maior do que um falso positivo — por exemplo, detecção de fraude, triagem de doenças.

Otimize para recall (sensibilidade). Aceite menor precisão.

Por quê: Recall = TP / (TP + FN). Maximizá-lo minimiza os positivos perdidos ao preço de mais falsos alarmes.

O modelo pontua alto nos dados de treinamento, mas mal nos dados de teste/produção; ou a acurácia primeiro melhora e depois degrada à medida que as épocas aumentam.

Overfitting. Mitigue com mais dados, regularização, early stopping, dropout ou modelo mais simples.

Por quê: Grande diferença entre treinamento e teste significa que o modelo memorizou ruído em vez de aprender padrões.

Escolha o serviço de IA gerenciado para uma tarefa de propósito único.

NLP/sentimento/entidades → Comprehend. Fala para texto → Transcribe. Texto para fala → Polly. Tradução → Translate. Chatbot/UI de voz → Lex. Imagem/vídeo → Rekognition. Extração de texto de Doc/PDF → Textract. Recomendações → Personalize. Previsão → Forecast.

Por quê: Serviços de IA gerenciados superam modelos personalizados quando a tarefa é bem definida e está no catálogo.

Referência

Fundamentos de IA Generativa

Construa uma aplicação de IA generativa na AWS sem gerenciar a infraestrutura do modelo.

Amazon Bedrock — acesso totalmente gerenciado a modelos de fundação (Anthropic Claude, Meta Llama, Amazon Titan, Stability, AI21, Mistral, Cohere) via uma única API.

Por quê: Sem provisionamento de GPU, sem hospedagem de modelo; pague por token. SageMaker JumpStart é a alternativa quando você precisa de um endpoint auto-hospedado em sua VPC.

Referência

Defina o que torna um modelo um "modelo de fundação".

Modelo grande pré-treinado em dados diversos, em sua maioria não rotulados; adaptável a muitas tarefas posteriores via prompting, fine-tuning ou RAG.

Estime quanto de entrada cabe em um prompt e o que impulsiona o custo de inferência.

Tokens são unidades subpalavras. Janela de contexto = tokens máximos por solicitação (entrada + saída). O custo de inferência é aproximadamente proporcional aos tokens processados.

Por quê: A contagem de tokens, não a contagem de solicitações, impulsiona o preço do Bedrock. Se um documento longo exceder a janela de contexto, fragmente-o ou escolha um modelo com janela maior.

Escolha o estilo de saída: determinístico vs criativo.

Temperatura baixa (~0.0–0.3) → determinístico, repetível. Temperatura alta (~0.7–1.0) → criativo, variado. Use 0 para classificação ou sentimento para obter rótulos consistentes.

Restrinja o pool de tokens candidatos além da temperatura.

Top-K = considere apenas os K tokens mais prováveis. Top-P (núcleo) = considere tokens até que a probabilidade cumulativa atinja P.

Por quê: Top-P adapta o tamanho do conjunto de candidatos ao formato da distribuição; Top-K tem largura fixa.

Obtenha a saída do LLM em um estilo, comprimento ou idioma específico.

Engenharia de prompt. Adicione instruções explícitas ("Responda em francês, com menos de 50 palavras, tom formal").

Por quê: Mais barato e rápido do que fine-tuning, retreinamento ou alteração do tamanho do modelo para controle estilístico.

Melhore a acurácia do LLM em uma tarefa específica sem retreinamento.

Few-shot prompting — incorpore 2 a 5 exemplos de entrada/saída rotulados no prompt antes da nova entrada.

Por quê: O aprendizado em contexto permite que o modelo faça correspondência de padrões contra exemplos sem atualizações de peso.

LLM dá respostas erradas em problemas de raciocínio de múltiplas etapas.

Chain-of-thought prompting — instrua o modelo a percorrer as etapas de raciocínio antes da resposta final ("Vamos pensar passo a passo").

LLM gera texto que soa plausível, mas é factualmente errado ou fabricado.

Alucinação. Mitigue com RAG (baseado em fatos recuperados), Bedrock Guardrails, temperatura mais baixa e revisão humana de saídas de alto risco.

Alimente busca semântica, clustering ou recuperação RAG sobre texto ou dados multimodais.

Use um modelo de embedding (por exemplo, Titan Embeddings, Cohere Embed) para converter conteúdo em vetores densos. Armazene e consulte em um DB vetorial.

Por quê: Embeddings capturam o significado semântico para que itens semelhantes se aproximem no espaço vetorial (similaridade de cosseno / produto escalar).

Referência

Aplicação de busca aceita texto e imagens como entrada.

Modelo de embedding multimodal (por exemplo, Titan Multimodal Embeddings) — projeta texto e imagens no mesmo espaço vetorial.

Referência

Prototipar um aplicativo de IA generativa rapidamente sem código ou configuração de conta AWS.

PartyRock (Amazon Bedrock Playground) — construtor de aplicativos sem código baseado em navegador.

Referência

Escolha um modelo de precificação do Bedrock.

Carga variável/imprevisível → Sob demanda (por token). Alto volume constante ou throughput garantido → Throughput Provisionado. Modelos personalizados ajustados → devem usar Throughput Provisionado.

Por quê: Sob demanda não tem compromisso; Throughput Provisionado compra capacidade dedicada em unidades de modelo.

Referência

Escolha a personalização mais barata que oferece a qualidade necessária.

Experimente nesta ordem: (1) engenharia de prompt, (2) RAG com uma base de conhecimento, (3) fine-tuning, (4) pré-treinamento contínuo.

Por quê: Esforço e custo aumentam a cada passo. Pare no primeiro que atenda ao requisito.

Aplicações de Modelos de Fundação

Aumente um modelo de fundação com dados privados da empresa (PDFs, documentos, conteúdo S3) sem fine-tuning.

Crie uma base de conhecimento do Amazon Bedrock. O Bedrock lida com ingestão, fragmentação, embedding e recuperação (RAG) no momento da inferência.

Por quê: Mais barato e rápido de atualizar do que fine-tuning. Mudanças nos dados de origem → ressincronize a KB; sem retreinamento.

Referência

Os dados mudam frequentemente (inventário, preços, notícias) e o modelo deve refletir o estado atual.

RAG com uma base de conhecimento. Evite fine-tuning — os ciclos de retreinamento não conseguem acompanhar.

Por quê: RAG separa o modelo dos dados; a KB é atualizada independentemente do modelo.

Faça fine-tuning de um modelo de fundação com exemplos rotulados para uma tarefa específica.

Forneça pares prompt-completion (instrução-resposta). O formato JSONL é padrão.

Por quê: O fine-tuning de instrução ensina o modelo a mapear as entradas do usuário para as saídas desejadas na tarefa alvo.

Referência

Ensine a um modelo de fundação vocabulário especializado (médico, jurídico, científico) usando muitos textos de domínio não rotulados.

Pré-treinamento contínuo no corpus de domínio não rotulado.

Por quê: O pré-treinamento contínuo atualiza a compreensão do modelo de vocabulário e conceitos; o fine-tuning de instrução ensina o comportamento da tarefa. Objetivo diferente, formato de dados diferente.

Referência

Fluxo de trabalho multi-etapas que combina raciocínio LLM com chamadas a APIs externas, bancos de dados ou serviços AWS.

Amazon Bedrock Agents — orquestra raciocínio LLM, invocação de ferramentas/API e síntese de resultados em um único tempo de execução gerenciado.

Por quê: Os Agents planejam etapas, chamam ferramentas e juntam os resultados em uma resposta final sem que você precise escrever o loop de orquestração.

Referência

Escolha um banco de dados vetorial para embeddings.

RAG gerenciado → Bedrock Knowledge Bases (lida com o armazenamento vetorial automaticamente). DB vetorial personalizado → OpenSearch Service (k-NN), Aurora PostgreSQL com pgvector, Neptune Analytics ou RDS para PostgreSQL com pgvector.

Por quê: OpenSearch é o padrão para k-NN de alta escala; pgvector reutiliza um DB relacional existente.

Referência

Implante um modelo ajustado do Bedrock para servir em produção.

Adquira Throughput Provisionado para o modelo Bedrock personalizado. Modelos personalizados não podem ser invocados via precificação sob demanda.

Por quê: A capacidade do modelo personalizado é dedicada, faturada em unidades de modelo e necessária para a invocação.

Referência

Estime ou reduza o custo de inferência do Bedrock.

Custo ≈ tokens processados × taxa por token. Reduza encurtando prompts, aparando exemplos few-shot, escolhendo modelos menores ou usando cache de prompt onde suportado.

Referência

Gere dados rotulados de alta precisão com revisão humana em loop (por exemplo, imagens especializadas, registros médicos).

Amazon SageMaker Ground Truth Plus — força de trabalho de rotulagem HITL gerenciada.

Por quê: Para auditoria periódica de previsões de modelo de baixa confiança, combine com Amazon A2I (Augmented AI).

Referência

O reconhecimento de fala entende mal termos específicos do domínio (médicos, jurídicos, nomes de marcas).

Amazon Transcribe com um modelo de linguagem personalizado ou vocabulário personalizado treinado em texto de domínio.

Referência

O modelo tem bom desempenho no treinamento, mas baixo desempenho em produção (overfit) — aumente a generalização sem mudar a arquitetura.

Aumente o volume e a diversidade dos dados de treinamento. Não corte dados nem apenas adicione hiperparâmetros.

Por quê: Dados mais representativos são a correção de maior alavancagem; a regularização e o early stopping ajudam, mas os dados dominam.

Avalie a qualidade da saída generativa.

Qualidade da tradução → BLEU. Qualidade do resumo → ROUGE. Similaridade semântica à referência → BERTScore. Preferência estilística → avaliação humana com conjuntos de prompt personalizados.

Escolha um modelo de fundação do Bedrock para um caso de uso onde o estilo de saída importa.

Realize avaliação humana em um conjunto de dados de prompt personalizado em todos os modelos candidatos. Não confie apenas em classificações públicas ou métricas de latência.

Por quê: O ajuste de estilo/tom é subjetivo; benchmarks não o capturam.

Referência

Gere gráficos e dashboards a partir de perguntas em linguagem natural sobre dados de negócios.

Amazon Q no QuickSight — BI em linguagem natural sobre conjuntos de dados do QuickSight.

Referência

Diretrizes para IA Responsável

Detecte viés em dados de treinamento ou previsões de modelo; produza relatórios de explicabilidade.

Amazon SageMaker Clarify. Executa métricas de viés em atributos protegidos pré e pós-treinamento, além de atribuição de características baseada em SHAP.

Por quê: Exigido para domínios regulamentados (empréstimos, contratação, saúde) onde você deve demonstrar justiça e explicabilidade.

Referência

O modelo tem desempenho pior para um grupo demográfico, étnico ou geográfico (por exemplo, sinaliza certos grupos desproporcionalmente).

Viés de amostragem. Reequilibre o conjunto de dados: aumento de dados para classes sub-representadas; garanta fontes diversas e representativas.

Por quê: Dados de treinamento que sub-representam grupos produzem modelos que os atendem mal. Corrija na camada de dados, não na camada do modelo.

Documente o uso pretendido de um modelo, dados de treinamento, desempenho, limitações e riscos para governança e auditoria.

Amazon SageMaker Model Cards — documentação estruturada e versionada vinculada ao modelo.

Referência

Restrinja tópicos de LLM, filtre conteúdo prejudicial, mascare PII ou bloqueie padrões de injeção de prompt.

Amazon Bedrock Guardrails. Configure tópicos negados, filtros de conteúdo (ódio, violência, sexual, insultos), filtros de palavras, filtros de informações sensíveis e verificações de fundamentação contextual.

Por quê: Aplicado tanto a entradas quanto a saídas; funciona em qualquer modelo Bedrock e em seus próprios modelos personalizados.

Referência

Determine a parcela de responsabilidade de segurança da empresa para uma implantação de IA generativa.

Matriz de Escopo de Segurança de IA Generativa da AWS. Escopo 1 (aplicativo de consumo, menor responsabilidade) → Escopo 5 (modelo auto-treinado, maior responsabilidade).

Por quê: Construir e treinar um modelo do zero em dados privados coloca a responsabilidade máxima de segurança na empresa.

Referência

Partes interessadas ou reguladores exigem uma explicação de como o modelo chega às suas previsões.

Use modelos interpretáveis quando possível (árvores de decisão, regressão linear/logística). Para modelos complexos, use Partial Dependence Plots, importância de características SHAP via SageMaker Clarify, ou SageMaker Model Cards.

Por quê: PDPs mostram o efeito marginal de cada característica; SHAP atribui contribuição por previsão; cartões de modelo capturam a história completa para auditoria.

A saída da IA generativa pode reproduzir material protegido por direitos autorais ou ser apresentada como trabalho autoral humano.

Risco de plágio / infração de IP. Mitigue com requisitos de citação, rastreamento de proveniência de conteúdo, marca d'água onde suportado, revisão humana e políticas claras de divulgação de conteúdo de IA.

Segurança, Conformidade e Governança para Soluções de IA

O aplicativo do modelo de fundação deve manter prompts e respostas na rede AWS — sem saída pública para a internet.

Bedrock com endpoints VPC (PrivateLink) para a API de tempo de execução. Bloqueie endpoints públicos do Bedrock com SCPs no nível da organização.

Por quê: O PrivateLink mantém as solicitações privadas e evita que os dados saiam da VPC; SCPs aplicam a regra em todas as contas.

Referência

Múltiplas equipes chamam o Bedrock contra dados S3 compartilhados; cada equipe deve acessar apenas seus próprios dados de cliente.

Crie uma função de serviço IAM por equipe que conceda acesso ao Bedrock apenas ao prefixo S3 ou chave KMS dessa equipe.

Por quê: Funções de serviço personalizadas impõem o menor privilégio no nível do recurso. Não conceda ao Bedrock acesso amplo ao S3 e confie na filtragem na camada do aplicativo.

O Bedrock falha ao ler dados S3 criptografados com SSE-KMS.

Conceda à função de serviço do Bedrock `kms:Decrypt` na CMK relevante e `s3:GetObject` no bucket/prefixo.

Por quê: O Bedrock assume sua função de serviço para ler os dados; a função precisa de permissões S3 e KMS.

Referência

Capture a atividade do Bedrock para monitoramento, depuração, auditoria e conformidade.

Dois serviços complementares. CloudTrail = quem/quando/de-onde para cada chamada de API (identidade, timestamp, IP de origem). Registro de invocação de modelo Bedrock = a carga útil real de prompt/resposta, escrita para CloudWatch Logs ou S3. Habilite ambos.

Por quê: O CloudTrail captura apenas metadados; o registro de invocação captura conteúdo. A conformidade frequentemente exige ambos.

Referência

O auditor solicita relatórios de conformidade da AWS (SOC, ISO, PCI, HIPAA) para a carga de trabalho de IA.

AWS Artifact — portal de autoatendimento para relatórios e acordos de conformidade da AWS sob demanda.

Por quê: O AWS Audit Manager audita continuamente seu uso; o AWS Artifact fornece as próprias atestações da AWS.

Referência

Descobrir e classificar PII ou outros dados sensíveis armazenados no S3 (corpus de treinamento, logs de modelo).

Amazon Macie — descoberta de dados sensíveis impulsionada por ML para S3.

Por quê: Use o Macie para encontrar dados que precisam de mascaramento, exclusão ou criptografia KMS antes que acabem em um modelo ou em suas saídas.

Referência

Entrada de usuário maliciosa tenta sobrescrever o prompt do sistema, exfiltrar dados ou desencadear ações não intencionais.

Defesa em profundidade: Bedrock Guardrails para filtragem de conteúdo, modelos de prompt que detectam/ignoram padrões de sobrescrita, limites de comprimento de entrada, validação de saída e permissões de ferramenta de menor privilégio para agentes.

Por quê: Nenhuma mitigação única é suficiente; combine filtragem de entrada, filtragem de saída e limites de capacidade.

Um modelo personalizado foi treinado com dados confidenciais que não deveriam vazar para as respostas.

Exclua o modelo, remova os registros confidenciais do conjunto de treinamento e retreine. A filtragem de saída não é suficiente.

Por quê: O conhecimento incorporado nos pesos do modelo não pode ser mascarado de forma confiável na inferência; apenas o retreinamento sem esses dados o remove.

Decida o que a AWS protege versus o que o cliente protege para uma carga de trabalho de IA.

Modelo de Responsabilidade Compartilhada da AWS: AWS = segurança DA nuvem (hardware, hypervisor, regiões). Cliente = segurança NA nuvem (dados, IAM, chaves KMS, rede, configuração de aplicativo).