Guía

AWS Certified AI Practitioner

Última revisión: abril de 2026

Una referencia escaneable de patrones arquitectónicos que evalúa el examen AIF-C01. Lee de arriba a abajo o salta a una sección.

Fundamentos de IA y ML

Elija un paradigma de aprendizaje: datos etiquetados, datos sin etiquetar o prueba y error interactiva.

Etiquetado → supervisado. Agrupación/segmentación sin etiquetar → no supervisado. El agente aprende por recompensa → por refuerzo.

Por qué: La elección está dictada por los datos existentes. RLHF es aprendizaje por refuerzo dirigido por valoraciones humanas, utilizado para alinear LLMs.

Referencia

Adapte un modelo preentrenado a una nueva tarea relacionada en lugar de entrenarlo desde cero.

Utilice el aprendizaje por transferencia. Ajuste el modelo existente en el nuevo conjunto de datos de dominio.

Por qué: Reutiliza representaciones aprendidas, reduce el tiempo de entrenamiento y las necesidades de datos frente a la construcción de un modelo desde cero.

Elija un modo de inferencia de SageMaker para la forma de la carga de trabajo.

Baja latencia constante → tiempo real. Tráfico intermitente/inactivo → serverless. Carga útil grande (≤1 GB) o trabajo largo (≤1 h) con casi tiempo real → asíncrono. Masivo fuera de línea → batch transform.

Por qué: El tiempo real tiene límites de carga útil/tiempo de espera; el asíncrono encola trabajos grandes; el procesamiento por lotes es para puntuación fuera de línea periódica.

Referencia

Múltiples equipos de ML necesitan compartir y reutilizar características diseñadas.

Amazon SageMaker Feature Store como repositorio central para características en línea + fuera de línea.

Por qué: Evita la ingeniería de características duplicada y mantiene la consistencia de entrenamiento/servicio entre equipos.

Referencia

Construya modelos de ML sin codificación ni experiencia en ML (ej. previsión de demanda para analistas).

Amazon SageMaker Canvas — interfaz visual no-code para entrenamiento e inferencia.

Referencia

Implemente un modelo fundacional rápidamente dentro de una VPC.

Amazon SageMaker JumpStart — modelos preentrenados se implementan como puntos finales de SageMaker en su VPC.

Por qué: JumpStart agrupa artefactos de modelos y cuadernos para una implementación con un solo clic enlazada a la VPC.

Referencia

Automatice el ajuste de hiperparámetros y la selección de modelos.

Amazon SageMaker Autopilot — explora algoritmos y ajusta hiperparámetros automáticamente.

Referencia

Elija la métrica de evaluación correcta para un modelo de clasificación.

Corrección de clasificación de imagen/binaria → accuracy. Desglose de clases → matriz de confusión. Clases desequilibradas → F1, precision, recall. Independiente del umbral → AUC.

Por qué: La accuracy engaña con datos desequilibrados; la matriz de confusión muestra recuentos de TP/FP/TN/FN; F1 equilibra precision y recall.

El costo de perder un positivo (falso negativo) es mucho mayor que el de un falso positivo — ej. detección de fraude, cribado de enfermedades.

Optimice para recall (sensibilidad). Acepte una precision menor.

Por qué: Recall = TP / (TP + FN). Maximizarlo minimiza los positivos perdidos a costa de más falsas alarmas.

El modelo puntúa alto en los datos de entrenamiento pero bajo en los datos de prueba/producción; o la accuracy primero mejora y luego se degrada a medida que aumentan las épocas.

Sobreajuste. Mitigue con más datos, regularización, detención temprana, dropout o un modelo más simple.

Por qué: Una gran brecha entre entrenamiento y prueba significa que el modelo memorizó ruido en lugar de aprender patrones.

Elija el servicio de IA gestionado para una tarea de propósito único.

NLP/sentimiento/entidades → Comprehend. Voz a texto → Transcribe. Texto a voz → Polly. Traducción → Translate. Chatbot/UI de voz → Lex. Imagen/video → Rekognition. Extracción de texto de documentos/PDF → Textract. Recomendaciones → Personalize. Previsión → Forecast.

Por qué: Los servicios de IA gestionados superan a los modelos personalizados cuando la tarea está bien definida y catalogada.

Referencia

Fundamentos de IA Generativa

Construya una aplicación de IA generativa en AWS sin gestionar la infraestructura del modelo.

Amazon Bedrock — acceso completamente gestionado a modelos fundacionales (Anthropic Claude, Meta Llama, Amazon Titan, Stability, AI21, Mistral, Cohere) a través de una única API.

Por qué: Sin aprovisionamiento de GPU, sin alojamiento de modelos; pague por token. SageMaker JumpStart es la alternativa cuando necesita un punto final autoalojado en su VPC.

Referencia

Defina qué hace que un modelo sea un "modelo fundacional".

Modelo grande preentrenado con datos diversos, en su mayoría sin etiquetar; adaptable a muchas tareas posteriores mediante prompting, fine-tuning o RAG.

Estime cuánta entrada cabe en un prompt y qué impulsa el costo de inferencia.

Los tokens son unidades sub-palabra. Ventana de contexto = tokens máximos por solicitud (entrada + salida). El costo de inferencia es aproximadamente proporcional a los tokens procesados.

Por qué: El recuento de tokens, no el recuento de solicitudes, impulsa los precios de Bedrock. Si un documento largo excede la ventana de contexto, divídalo en fragmentos o elija un modelo con una ventana más grande.

Elija el estilo de salida: determinista vs creativo.

Temperatura baja (~0.0–0.3) → determinista, repetible. Temperatura alta (~0.7–1.0) → creativo, variado. Use 0 para clasificación o sentimiento para obtener etiquetas consistentes.

Restrinja el grupo de tokens candidatos más allá de la temperatura.

Top-K = considere solo los K tokens más probables. Top-P (núcleo) = considere tokens hasta que la probabilidad acumulada alcance P.

Por qué: Top-P adapta el tamaño del conjunto candidato a la forma de la distribución; Top-K es de ancho fijo.

Obtenga la salida del LLM en un estilo, longitud o idioma específico.

Ingeniería de prompts. Añada instrucciones explícitas ("Responda en francés, menos de 50 palabras, tono formal").

Por qué: Más barato y rápido que el fine-tuning, el reentrenamiento o cambiar el tamaño del modelo para control estilístico.

Mejore la precisión del LLM en una tarea específica sin reentrenar.

Prompting de pocas tomas (few-shot prompting) — incruste 2-5 ejemplos etiquetados de entrada/salida en el prompt antes de la nueva entrada.

Por qué: El aprendizaje en contexto permite al modelo hacer coincidir patrones con ejemplos sin actualizaciones de pesos.

El LLM da respuestas incorrectas en problemas de razonamiento de varios pasos.

Prompting de cadena de pensamiento (Chain-of-thought prompting) — instruya al modelo para que recorra los pasos de razonamiento antes de la respuesta final ("Pensemos paso a paso").

El LLM genera texto que suena plausible pero es fácticamente incorrecto o fabricado.

Alucinación. Mitigue con RAG (basado en hechos recuperados), Bedrock Guardrails, temperatura más baja y revisión humana de las salidas de alto riesgo.

Potencie la búsqueda semántica, la agrupación o la recuperación RAG sobre texto o datos multimodales.

Utilice un modelo de incrustación (embedding model) (ej. Titan Embeddings, Cohere Embed) para convertir contenido en vectores densos. Almacene y consulte en una base de datos vectorial.

Por qué: Los embeddings capturan el significado semántico para que elementos similares se agrupen cerca unos de otros en el espacio vectorial (similitud de coseno / producto escalar).

Referencia

La aplicación de búsqueda acepta texto e imágenes como entrada.

Modelo de embedding multimodal (ej. Titan Multimodal Embeddings) — proyecta texto e imágenes en el mismo espacio vectorial.

Referencia

Cree un prototipo de aplicación de IA generativa rápidamente sin código ni configuración de cuenta de AWS.

PartyRock (Amazon Bedrock Playground) — constructor de aplicaciones sin código basado en navegador.

Referencia

Elija un modelo de precios de Bedrock.

Carga variable / impredecible → Bajo demanda (per-token). Alto volumen constante o rendimiento garantizado → Rendimiento Aprovisionado (Provisioned Throughput). Modelos personalizados fine-tuned → deben usar Rendimiento Aprovisionado.

Por qué: Bajo demanda no tiene compromiso; Rendimiento Aprovisionado compra capacidad dedicada en unidades de modelo.

Referencia

Elija la personalización más barata que le proporcione la calidad que necesita.

Pruebe en este orden: (1) ingeniería de prompts, (2) RAG con una base de conocimientos, (3) fine-tuning, (4) preentrenamiento continuado.

Por qué: El esfuerzo y el costo aumentan en cada paso. Deténgase en el primero que cumpla el estándar.

Aplicaciones de Modelos Fundacionales

Aumente un modelo fundacional con datos privados de la empresa (PDFs, documentos, contenido de S3) sin fine-tuning.

Cree una base de conocimientos de Amazon Bedrock (Knowledge Base). Bedrock maneja la ingesta, fragmentación, incrustación (embedding) y recuperación (RAG) en el momento de la inferencia.

Por qué: Más barato y rápido de actualizar que el fine-tuning. Los datos de origen cambian → resincronice la KB; sin reentrenamiento.

Referencia

Los datos cambian con frecuencia (inventario, precios, noticias) y el modelo debe reflejar el estado actual.

RAG con una base de conocimientos. Evite el fine-tuning — los ciclos de reentrenamiento no pueden seguir el ritmo.

Por qué: RAG separa el modelo de los datos; la KB se actualiza independientemente del modelo.

Ajuste un modelo fundacional con ejemplos etiquetados para una tarea específica.

Proporcione pares prompt-completado (instrucción-respuesta). El formato JSONL es estándar.

Por qué: El fine-tuning de instrucciones enseña al modelo a mapear las entradas del usuario a las salidas deseadas en la tarea objetivo.

Referencia

Enseñe a un modelo fundacional vocabulario especializado (médico, legal, científico) utilizando mucho texto de dominio sin etiquetar.

Preentrenamiento continuado en el corpus de dominio sin etiquetar.

Por qué: El preentrenamiento continuado actualiza la comprensión del modelo de vocabulario y conceptos; el fine-tuning de instrucciones enseña el comportamiento de la tarea. Objetivo diferente, forma de datos diferente.

Referencia

Flujo de trabajo multi-paso que combina el razonamiento del LLM con llamadas a APIs externas, bases de datos o servicios de AWS.

Amazon Bedrock Agents — orquesta el razonamiento del LLM, la invocación de herramientas/API y la síntesis de resultados en un único tiempo de ejecución gestionado.

Por qué: Los agentes planifican los pasos, llaman a las herramientas y unen los resultados en una respuesta final sin que usted escriba el bucle de orquestación.

Referencia

Elija una base de datos vectorial para embeddings.

RAG gestionado → Bedrock Knowledge Bases (maneja el almacén de vectores automáticamente). Base de datos vectorial personalizada → OpenSearch Service (k-NN), Aurora PostgreSQL con pgvector, Neptune Analytics o RDS para PostgreSQL con pgvector.

Por qué: OpenSearch es el predeterminado para k-NN a gran escala; pgvector reutiliza una base de datos relacional existente.

Referencia

Implemente un modelo fine-tuned de Bedrock para el servicio de producción.

Compre Rendimiento Aprovisionado para el modelo personalizado de Bedrock. Los modelos personalizados no se pueden invocar a través de precios bajo demanda.

Por qué: La capacidad del modelo personalizado es dedicada, facturada en unidades de modelo y requerida para la invocación.

Referencia

Estime o reduzca el costo de inferencia de Bedrock.

Costo ≈ tokens procesados × tarifa por token. Reduzca acortando prompts, recortando ejemplos de pocas tomas, eligiendo modelos más pequeños o usando el almacenamiento en caché de prompts donde sea compatible.

Referencia

Genere datos etiquetados de alta precisión con revisión humana (ej. imágenes especializadas, registros médicos).

Amazon SageMaker Ground Truth Plus — fuerza de trabajo de etiquetado HITL gestionada.

Por qué: Para la auditoría periódica de predicciones de modelos de baja confianza, combínelo con Amazon A2I (Augmented AI).

Referencia

El reconocimiento de voz entiende mal términos específicos del dominio (médicos, legales, nombres de marcas).

Amazon Transcribe con un modelo de lenguaje personalizado o vocabulario personalizado entrenado en texto de dominio.

Referencia

El modelo funciona bien en el entrenamiento pero mal en producción (sobreajuste) — aumente la generalización sin cambiar la arquitectura.

Aumente el volumen y la diversidad de los datos de entrenamiento. No reduzca datos ni solo añada hiperparámetros.

Por qué: Más datos representativos es la solución de mayor impacto; la regularización y la detención temprana ayudan, pero los datos dominan.

Evalúe la calidad de la salida generativa.

Calidad de traducción → BLEU. Calidad de resumen → ROUGE. Similitud semántica con la referencia → BERTScore. Preferencia estilística → evaluación humana con conjuntos de prompts personalizados.

Elija un modelo fundacional de Bedrock para un caso de uso donde el estilo de salida importa.

Realice una evaluación humana en un conjunto de datos de prompts personalizados en todos los modelos candidatos. No confíe únicamente en las tablas de clasificación públicas o las métricas de latencia.

Por qué: El ajuste de estilo/tono es subjetivo; los benchmarks no lo capturan.

Referencia

Genere gráficos y paneles a partir de preguntas en lenguaje natural sobre datos comerciales.

Amazon Q en QuickSight — BI en lenguaje natural sobre conjuntos de datos de QuickSight.

Referencia

Pautas para una IA Responsable

Detecte sesgos en los datos de entrenamiento o en las predicciones del modelo; genere informes de explicabilidad.

Amazon SageMaker Clarify. Ejecuta métricas de sesgo en atributos protegidos antes y después del entrenamiento, además de atribución de características basada en SHAP.

Por qué: Requerido para dominios regulados (préstamos, contratación, atención médica) donde debe demostrar imparcialidad y explicabilidad.

Referencia

El modelo funciona peor para un grupo demográfico, étnico o geográfico (ej. marca ciertos grupos de forma desproporcionada).

Sesgo de muestreo. Reequilibre el conjunto de datos: aumento de datos para clases subrepresentadas; asegure fuentes diversas y representativas.

Por qué: Los datos de entrenamiento que subrepresentan a ciertos grupos producen modelos que los atienden deficientemente. Corrija en la capa de datos, no en la capa del modelo.

Documente el uso previsto de un modelo, los datos de entrenamiento, el rendimiento, las limitaciones y los riesgos para la gobernanza y la auditoría.

Amazon SageMaker Model Cards — documentación estructurada y versionada vinculada al modelo.

Referencia

Restrinja temas del LLM, filtre contenido dañino, enmascare PII o bloquee patrones de inyección de prompts.

Amazon Bedrock Guardrails. Configure temas denegados, filtros de contenido (odio, violencia, sexual, insultos), filtros de palabras, filtros de información sensible y verificaciones de fundamentación contextual.

Por qué: Aplicado tanto a entradas como a salidas; funciona en cualquier modelo de Bedrock y en sus propios modelos personalizados.

Referencia

Determine la parte de responsabilidad de seguridad de la empresa para una implementación de IA generativa.

Matriz de Alcance de Seguridad de IA Generativa de AWS. Alcance 1 (aplicación de consumidor, menor responsabilidad) → Alcance 5 (modelo autoentrenado, mayor responsabilidad).

Por qué: Construir y entrenar un modelo desde cero con datos privados impone la máxima responsabilidad de seguridad a la empresa.

Referencia

Las partes interesadas o los reguladores requieren una explicación de cómo el modelo llega a sus predicciones.

Utilice modelos interpretables cuando sea posible (árboles de decisión, regresión lineal/logística). Para modelos complejos, use Gráficos de Dependencia Parcial (Partial Dependence Plots), importancia de características SHAP a través de SageMaker Clarify o SageMaker Model Cards.

Por qué: Los PDPs muestran el efecto marginal de cada característica; SHAP atribuye la contribución por predicción; las tarjetas de modelo capturan toda la historia para la auditoría.

La salida de IA generativa puede reproducir material protegido por derechos de autor o ser presentada como obra de autoría humana.

Riesgo de plagio / infracción de propiedad intelectual. Mitigue con requisitos de citación, seguimiento de la procedencia del contenido, marca de agua donde sea compatible, revisión humana y políticas claras de divulgación de contenido de IA.

Seguridad, Cumplimiento y Gobernanza para Soluciones de IA

La aplicación de modelo fundacional debe mantener los prompts y respuestas en la red de AWS — sin salida a internet pública.

Bedrock con puntos finales de VPC (PrivateLink) para la API de tiempo de ejecución. Bloquee los puntos finales públicos de Bedrock con SCPs a nivel de organización.

Por qué: PrivateLink mantiene las solicitudes privadas y evita que los datos salgan de la VPC; los SCPs aplican la regla en todas las cuentas.

Referencia

Múltiples equipos llaman a Bedrock contra datos compartidos de S3; cada equipo solo debe acceder a sus propios datos de cliente.

Cree un rol de servicio de IAM por equipo que otorgue a Bedrock acceso solo al prefijo S3 o clave KMS de ese equipo.

Por qué: Los roles de servicio personalizados aplican el principio de mínimo privilegio a nivel de recurso. No dé a Bedrock un acceso amplio a S3 y confíe en el filtrado a nivel de aplicación.

Bedrock no puede leer datos de S3 cifrados con SSE-KMS.

Otorgue al rol de servicio de Bedrock `kms:Decrypt` en la CMK relevante y `s3:GetObject` en el bucket/prefijo.

Por qué: Bedrock asume su rol de servicio para leer los datos; el rol necesita permisos tanto de S3 como de KMS.

Referencia

Capture la actividad de Bedrock para monitoreo, depuración, auditoría y cumplimiento.

Dos servicios complementarios. CloudTrail = quién/cuándo/desde dónde para cada llamada API (identidad, marca de tiempo, IP de origen). Registro de invocación de modelos de Bedrock = la carga útil real del prompt/respuesta, escrita en CloudWatch Logs o S3. Habilite ambos.

Por qué: CloudTrail captura solo metadatos; el registro de invocación captura contenido. El cumplimiento a menudo requiere ambos.

Referencia

El auditor solicita informes de cumplimiento de AWS (SOC, ISO, PCI, HIPAA) para la carga de trabajo de IA.

AWS Artifact — portal de autoservicio para informes y acuerdos de cumplimiento de AWS bajo demanda.

Por qué: AWS Audit Manager audita continuamente su uso; AWS Artifact proporciona las propias certificaciones de AWS.

Referencia

Descubra y clasifique PII u otros datos sensibles almacenados en S3 (corpus de entrenamiento, registros de modelos).

Amazon Macie — descubrimiento de datos sensibles basado en ML para S3.

Por qué: Utilice Macie para encontrar datos que necesitan enmascaramiento, eliminación o cifrado KMS antes de que terminen en un modelo o sus salidas.

Referencia

La entrada de usuario maliciosa intenta anular el prompt del sistema, extraer datos o desencadenar acciones no deseadas.

Defensa en profundidad: Bedrock Guardrails para el filtrado de contenido, plantillas de prompts que detectan/ignoran patrones de anulación, límites de longitud de entrada, validación de salida y permisos de herramientas de mínimo privilegio para los agentes.

Por qué: Ninguna mitigación única es suficiente; combine el filtrado de entrada, el filtrado de salida y los límites de capacidad.

Un modelo personalizado fue entrenado con datos confidenciales que no deberían filtrarse en las respuestas.

Elimine el modelo, depure los registros confidenciales del conjunto de entrenamiento y reentrene. El filtrado de salida no es suficiente.

Por qué: El conocimiento incrustado en los pesos del modelo no puede ser enmascarado de forma fiable en la inferencia; solo el reentrenamiento sin esos datos lo elimina.

Decida qué asegura AWS frente a qué asegura el cliente para una carga de trabajo de IA.

Modelo de Responsabilidad Compartida de AWS: AWS = seguridad DE la nube (hardware, hipervisor, regiones). Cliente = seguridad EN la nube (datos, IAM, claves KMS, red, configuración de la aplicación).