Guía

AWS Certified Developer Associate

Última revisión: mayo de 2026

Una referencia escaneable de patrones arquitectónicos que evalúa el examen DVA-C02. Lee de arriba a abajo o salta a una sección.

Desarrollo con Servicios de AWS

Objetivo de invocación estable mientras se sube nuevo código Lambda.

Publicar versiones numeradas e inmutables; exponer un alias que apunte a una versión. Los llamadores invocan el ARN del alias.

Por qué: Las versiones son instantáneas congeladas de código + configuración; los alias proporcionan indirección para que los llamadores nunca invoquen `$LATEST` directamente.

Referencia

Despliegue gradual de una nueva versión Lambda con rollback automático en caso de errores.

Alias con enrutamiento de versiones ponderado (por ejemplo, 90/10). CodeDeploy `LambdaCanary10Percent5Minutes` o `LambdaLinear*` desplaza el tráfico y monitorea las alarmas de CloudWatch.

Por qué: El desplazamiento de tráfico incorporado + el rollback impulsado por alarmas elimina la lógica canary codificada a mano.

Referencia

Inyectar configuración (URL de BD, indicadores de funciones) sin volver a desplegar.

Variables de entorno de Lambda. Cifradas en reposo con KMS; referenciar una CMK personalizada para cifrado adicional en tránsito en el momento de la recuperación.

Referencia

Compartir NumPy / pandas / runtime común entre muchas Lambdas.

Empaquetar como una capa Lambda; hasta 5 capas por función, 250 MB en total sin comprimir. ARN versionado por capa.

Referencia

Lambda síncrona sensible a la latencia — no se permiten arranques en frío.

Concurrencia aprovisionada en el alias. Preinicializa N entornos de ejecución; se paga por GB-segundo.

Por qué: Elimina el arranque en frío a un costo predecible. Configure el autoescalado de la aplicación en el alias para ajustarse a la carga.

Referencia

Lambda de Java o Python con código de inicialización pesado; necesita un arranque en frío rápido sin pagar por la Concurrencia Aprovisionada.

Habilitar SnapStart en una versión publicada. AWS toma instantáneas del runtime inicializado y se reanuda desde ellas.

Por qué: Gratis para Java; se cobra por restauración para Python/.NET. Reduce los arranques en frío de segundos a <1s sin costo por inactividad.

Referencia

Lambda necesita consumir un stream de Kinesis / DynamoDB Stream / cola SQS / tópico MSK.

Mapeo de origen de evento (basado en pull). Lambda sondea; el tamaño de lote + la ventana de lotes máxima ajustan el rendimiento vs la latencia. Fallo → DLQ a través del destino On-Failure.

Por qué: Para fuentes pull, el servicio no puede invocar Lambda directamente; el mapeo es el adaptador de sondeo de Lambda.

Referencia

Enrutamiento de éxito/fallo de Lambda asíncrono sin DLQ de Lambda.

Destinos OnSuccess / OnFailure en la función. Destinos: SNS, SQS, EventBridge, otra Lambda. Incluye el contexto de invocación.

Por qué: Los destinos capturan el evento completo + respuesta; el DLQ heredado solo captura el payload del evento.

Referencia

Elegir tipo de API Gateway para una nueva API REST.

HTTP API: más barata, más rápida, autenticación JWT integrada, más simple. REST API: características completas (plantillas de mapeo, validadores de solicitudes, WAF, puntos finales privados, X-Ray, caché de API).

Por qué: Por defecto, use HTTP API a menos que necesite una característica exclusiva de REST. Las API WebSocket son un producto separado para tiempo real con estado.

Referencia

Promover cambios de API de dev → test → prod sin volver a desplegar APIs separadas.

Etapas en una sola API. Despliegue una etapa para publicar; las variables de etapa contienen valores específicos del entorno, como nombres de alias de Lambda.

Referencia

La Lambda de backend espera una forma diferente a la que envía el cliente.

Plantilla de mapeo de solicitud/respuesta (solo REST API). VTL con `$input`, `$context`, `$util` para transformar JSON.

Por qué: Las plantillas de mapeo se ejecutan en API Gateway — sin salto adicional a Lambda, sin latencia o costo extra.

Referencia

Validar un token personalizado (no Cognito, no IAM) antes de enrutar la solicitud.

Autorizador Lambda. El tipo TOKEN lee un encabezado; el tipo REQUEST lee el contexto completo de la solicitud. Devuelve política IAM + principalId. Cacheado por identidad para TTL.

Referencia

Validar un JWT de Cognito User Pool en cada solicitud.

Autorizador de Cognito User Pool (REST) o autorizador JWT (HTTP). API Gateway valida el token; no se necesita Lambda.

Por qué: La validación nativa es más barata y rápida que un autorizador Lambda para el caso común de JWT.

Referencia

Controlar/limitar a un consumidor de API asociado.

Plan de Uso + Clave de API. El plan vincula las claves a una etapa con límite de tasa (solicitudes/seg) + ráfaga + cuota (solicitudes/día o mes).

Referencia

Reducir la carga del backend para solicitudes GET repetidas.

Caché a nivel de etapa (REST API). TTL configurable; clave de caché derivada de método + ruta + parámetros de consulta/encabezado seleccionados.

Referencia

Actualizar un ítem solo si se cumple una precondición (por ejemplo, status == "PENDING").

PutItem/UpdateItem con `ConditionExpression`. El fallo genera `ConditionalCheckFailedException`.

Por qué: La verificación del lado del servidor evita condiciones de carrera de lectura-modificación-escritura sin bloqueo.

Referencia

Todo o nada entre múltiples ítems de DynamoDB.

`TransactWriteItems` / `TransactGetItems`. Hasta 100 ítems / 4 MB; 2 veces el costo de WCU/RCU de escrituras/lecturas normales.

Referencia

Incrementar un contador sin lectura-modificación-escritura.

UpdateExpression `ADD count :inc`. El servidor aplica el delta atómicamente.

Referencia

Iterar un gran conjunto de resultados de consulta/escaneo.

`LastEvaluatedKey` de la respuesta → `ExclusiveStartKey` en la siguiente llamada hasta que esté ausente. Limitar vía parámetro `Limit`.

Referencia

Necesita un patrón de acceso adicional más allá de la clave primaria.

GSI: clave de partición + ordenación alternativa, eventualmente consistente, capacidad separada, se puede añadir en cualquier momento. LSI: misma clave de partición, clave de ordenación alternativa, opción de consistencia fuerte, debe crearse al crear la tabla.

Referencia

Indexar solo ítems que tienen un atributo particular (por ejemplo, solo órdenes ACTIVE).

Índice disperso: omita el atributo en los ítems que desea excluir. Los ítems sin el atributo indexado no aparecen en el GSI/LSI.

Referencia

Lectura/escritura masiva de muchos ítems.

`BatchGetItem` (hasta 100 ítems / 16 MB) y `BatchWriteItem` (hasta 25 ítems / 16 MB). No atómico; fallos parciales devueltos en `UnprocessedItems`.

Referencia

Prevenir actualizaciones perdidas por escritores concurrentes.

Atributo de versión + `ConditionExpression: version = :v`. Las escrituras fallidas se reintentan releyendo.

Referencia

Activar acciones posteriores en cada cambio de DynamoDB.

DynamoDB Streams + mapeo de origen de eventos de Lambda. Vista de stream: NEW_IMAGE / OLD_IMAGE / NEW_AND_OLD_IMAGES / KEYS_ONLY.

Referencia

El navegador sube/descarga directamente a S3 sin que su servidor haga proxy de bytes.

SDK `getSignedUrl` para GET o PUT. Expiración de hasta 7 días cuando se firma por usuario IAM (sigv4); más corta para sesiones derivadas de roles.

Por qué: Descarga ancho de banda de su backend; la URL es una capacidad temporal limitada a un objeto + método.

Referencia

Subir un archivo grande (≫100 MB) de forma fiable desde el SDK.

`CreateMultipartUpload` → `UploadPart` en paralelo → `CompleteMultipartUpload`. El gestor de transferencias de alto nivel del SDK maneja el tamaño de las partes automáticamente.

Por qué: Requerido >5 GB; recomendado ≥100 MB. Las partes fallidas se vuelven a subir de forma independiente. Configure el ciclo de vida para abortar multiparts incompletos para recuperar almacenamiento.

Referencia

Ejecutar código cuando se crea/elimina un objeto en S3.

S3 Event Notifications → Lambda / SNS / SQS / EventBridge. Filtrar por prefijo y sufijo.

Referencia

La aplicación del navegador obtiene datos de S3 a través de orígenes (`fetch('https://bucket.s3...')`); la pre-solicitud CORS falla.

Configurar reglas CORS del bucket: orígenes permitidos, métodos (GET/PUT), encabezados y encabezados expuestos.

Referencia

Filtrar filas de un objeto CSV/JSON/Parquet de 50 GB sin descargarlo.

S3 Select con SQL. Devuelve solo las filas coincidentes; se paga por el escaneo + los bytes devueltos.

Referencia

Iniciar sesión de un usuario desde un cliente móvil/web público sin enviar la contraseña.

Cognito User Pool con flujo `USER_SRP_AUTH`. El cliente calcula la prueba SRP; el backend nunca ve la contraseña. Devuelve tokens de ID + acceso + actualización.

Referencia

Usuario federado (Google/Apple/Cognito UP) necesita credenciales temporales de AWS para llamar directamente a las API de AWS desde una aplicación móvil.

Cognito Identity Pool. Intercambia token de proveedor de identidad → rol IAM → credenciales temporales de AWS vía STS.

Por qué: Los User Pools autentican usuarios; los Identity Pools los autorizan a recursos de AWS.

Referencia

Elegir un tipo de flujo de trabajo de Step Functions.

Standard: de larga duración (≤1 año), exactamente una vez, $0.025/1k transiciones, historial completo. Express: ≤5 min, al menos una vez o como máximo una vez, se factura por solicitud + duración; para ETL/streaming de alto volumen.

Referencia

Un paso del flujo de trabajo falla; quiere reintento con retroceso y enrutamiento a un estado de recuperación.

Matriz `Retry` (por estado, con `BackoffRate` + `MaxAttempts`) y `Catch` para enrutamiento de fallos terminales. Coincidir por `ErrorEquals` (por ejemplo, `States.TaskFailed`, nombres de error personalizados).

Referencia

Aplicar el mismo flujo de trabajo a cada ítem en una matriz, con límite de concurrencia.

Estado Map con `ItemsPath` y `MaxConcurrency`. Distributed Map maneja más de 10k ítems con entrada respaldada por S3.

Referencia

Activar Lambda en un horario cron o al coincidir eventos entrantes.

Regla de EventBridge. Programación: `rate(...)` o `cron(...)`. Patrón: filtro de eventos JSON; coincide con fuente, tipo de detalle, campos de detalle.

Referencia

Enrutar eventos de SQS / Kinesis / DynamoDB Streams / MSK a un destino con filtro + transformación opcionales.

EventBridge Pipes. Origen → Filtro → Enriquecimiento (Lambda/Step Functions) → Destino. No se necesita Lambda para los casos simples.

Referencia

Procesar mensajes estrictamente en orden por cliente, con deduplicación.

Cola SQS FIFO. `MessageGroupId` particiona el ordenamiento (paralelismo por grupo); `MessageDeduplicationId` (o deduplicación basada en contenido) elimina duplicados en 5 minutos.

Referencia

El consumidor extrae un mensaje pero falla antes de eliminarlo.

Mensaje oculto durante VisibilityTimeout segundos, luego reaparece para reentrega. Ajustar al tiempo de procesamiento más largo esperado + buffer.

Por qué: Demasiado corto → procesamiento duplicado. Demasiado largo → recuperación lenta en caso de fallo. ChangeMessageVisibility extiende el tiempo en tránsito si es necesario.

Referencia

Ajustar la capacidad de Kinesis Data Streams para el rendimiento de escritura.

Cada shard = 1 MB/s o 1000 registros/s de entrada, 2 MB/s de salida. Añadir shards (dividir) o usar el modo On-Demand para autoescalado.

Referencia

Seguridad

El código en EC2 / tarea ECS / Lambda necesita acceso a AWS — sin claves embebidas.

Adjuntar un rol IAM vía perfil de instancia (EC2) o rol de tarea/ejecución (ECS/Lambda). El SDK obtiene credenciales temporales del servicio de metadatos; se auto-rota.

Referencia

Acceso entre cuentas desde el código de la aplicación o la CLI.

`sts:AssumeRole` desde el principal del llamador. La política de confianza del rol de destino enumera al llamador como `Principal`. Devuelve credenciales temporales (máximo 12 horas).

Referencia

AssumeRole entre cuentas está fallando — el permiso parece correcto.

Ambos deben estar configurados: la política de confianza en el rol de destino lista al llamador como Principal; la política de identidad del llamador permite `sts:AssumeRole` en el ARN del rol de destino.

Por qué: Confianza = quién puede asumir. Permiso = qué pueden hacer una vez asumido. Cualquiera que falte → AccessDenied.

Referencia

Política que otorga a los usuarios acceso solo a su propia carpeta en S3.

Usar `${aws:username}` o `${aws:PrincipalTag/X}` en los ARNs de recursos: `arn:aws:s3:::bucket/${aws:username}/*`.

Referencia

Permitir que un equipo autogestione roles IAM, pero limitar los permisos que pueden otorgar.

Política de límites de permisos en el rol creador del equipo. Cualquier rol que creen con el límite tendrá la intersección de la política de identidad + el límite como permisos efectivos.

Referencia

Restringir una acción por IP de origen / VPC / región / MFA.

`Condition` de política: `aws:SourceIp`, `aws:SourceVpc`, `aws:SourceVpce`, `aws:RequestedRegion`, `aws:MultiFactorAuthPresent`.

Referencia

Cliente SPA / móvil vs servicio de lado del servidor llamando a Cognito.

Clientes públicos (SPA, móvil) → cliente de aplicación sin secreto. Clientes confidenciales (servidor) → cliente de aplicación con secreto; el cliente debe incluir `SECRET_HASH` (HMAC de nombre de usuario + clientId).

Referencia

Distinguir token de ID de Cognito vs token de Acceso vs token de Actualización.

ID = claims de identidad de usuario (consumir en cliente). Acceso = autorización con ámbito para APIs. Actualización = obtener nuevos tokens de ID/acceso. Todos son JWTs excepto el de Actualización.

Referencia

UI de inicio de sesión/registro lista para usar sin construir formularios.

Cognito Hosted UI. Flujo de código de autorización OAuth2: redirigir a `/oauth2/authorize` → URL de callback con `code` → intercambiar en `/oauth2/token`.

Referencia

Cifrar un secreto pequeño (≤4 KB) directamente con KMS.

`kms:Encrypt` devuelve un blob de texto cifrado que contiene el ARN de la clave. `kms:Decrypt` recupera el texto plano si el llamador tiene permiso y (si se especifica) `EncryptionContext` coincide.

Referencia

Cifrar grandes cantidades de datos con KMS sin alcanzar el límite de cifrado directo de 4 KB.

Cifrado de envolvente. `GenerateDataKey` devuelve DEK en texto plano + cifrado; cifrar datos localmente con DEK, almacenar DEK cifrado junto, descartar DEK en texto plano.

Por qué: KMS aplica control de acceso en el DEK pequeño; el cifrado masivo ocurre localmente a velocidad de línea.

Referencia

Otorgar a otro principal acceso limitado en el tiempo a una CMK sin editar la política de clave.

Crear una concesión `kms:CreateGrant` que delimita las operaciones + el concesionario. Revocar con `RetireGrant`.

Referencia

Referenciar una clave KMS indirectamente para que la CMK subyacente pueda rotar sin cambios en el código.

Usar `alias/my-key` (o `arn:aws:kms:region:acct:alias/my-key`). Actualizar el alias para que apunte a una nueva CMK; los consumidores siguen funcionando.

Referencia

Elegir un almacén de credenciales.

Secrets Manager: rotación integrada, integración nativa con RDS/Redshift/DocumentDB, $0.40/secreto/mes. Parameter Store SecureString: capa gratuita (Estándar), sin rotación integrada, rutas estratificadas `/app/env/key`.

Referencia

Rotar credenciales de RDS automáticamente.

Rotación nativa de Secrets Manager (Lambda gestionada) para Aurora/RDS/DocumentDB/Redshift. El patrón maestro/usuario utiliza un secreto maestro separado para rotar el secreto de usuario.

Referencia

Almacenar un valor de configuración con cifrado KMS en reposo en Parameter Store.

Tipo de parámetro SecureString. Especificar `--key-id` para una CMK personalizada; de lo contrario, usa `aws/ssm`. El descifrado requiere `kms:Decrypt` en la CMK.

Referencia

Restringir el acceso a CloudFront a usuarios autenticados.

URLs firmadas (recurso único) o cookies firmadas (múltiples recursos, SPAs/streaming). Firmar con un par de claves de CloudFront almacenado como clave pública en el grupo de claves de CloudFront.

Referencia

Elegir cifrado del lado del servidor de S3.

SSE-S3 (AES-256 gestionado, predeterminado), SSE-KMS (CMK, auditoría vía CloudTrail, política de clave), SSE-C (claves suministradas por el cliente, usted las gestiona), DSSE-KMS (doble capa para alta conformidad).

Referencia

Encontrar roles/políticas que otorgan acceso fuera de la cuenta o son demasiado permisivas.

IAM Access Analyzer. Hallazgos sobre acceso externo; generación de políticas a partir del historial de CloudTrail para el dimensionamiento de privilegios mínimos.

Referencia

La variable de entorno de Lambda contiene un valor sensible.

Lambda cifra las variables de entorno en reposo con KMS por defecto. Para control en tránsito/en descifrado, configure una CMK personalizada y use los ayudantes de cifrado en la consola para enviar texto cifrado pre-cifrado.

Referencia

El navegador → API Gateway con encabezado `Authorization` es bloqueado por pre-solicitud.

Añadir método OPTIONS (integración simulada). Permitir `Authorization` en `Access-Control-Allow-Headers`; permitir llamadores en `Access-Control-Allow-Origin`.

Referencia

Firmar una solicitud HTTP personalizada a un servicio de AWS desde código que no es SDK.

Sigv4: derivar clave de firma de secreto + fecha + región + servicio; canonicar solicitud; firmar; añadir encabezados `Authorization`, `X-Amz-Date`, `X-Amz-Security-Token`.

Referencia

Asumir un rol amplio pero limitar el alcance para una sesión específica.

`AssumeRole` con `Policy` (política de sesión en línea) restringe aún más los permisos efectivos: intersección de rol + política de sesión.

Referencia

Acceso a S3 denegado a pesar de que la política IAM lo permite.

Se evalúan tanto la política de bucket como la política de identidad. Una denegación explícita en cualquier lugar tiene prioridad. La configuración de Bloqueo de Acceso Público también puede anular el permiso.

Referencia

Implementación

Construir un pipeline CI/CD: fuente → construcción → prueba → despliegue con aprobación manual de producción.

Etapas de CodePipeline, cada una con una o más acciones. Acción de Aprobación Manual entre Prueba y Despliegue. Fuente = CodeCommit / GitHub / S3 / ECR.

Referencia

Definir pasos de construcción para CodeBuild.

`buildspec.yml` en la raíz del repositorio. Fases: `install`, `pre_build`, `build`, `post_build`. Salidas: `artifacts.files`, `cache.paths`. Variables de entorno vía `env.variables` o referencias a Parameter Store/Secrets Manager.

Referencia

Desviar el tráfico de Lambda 10% y luego 100% con rollback automático en caso de alarmas.

CodeDeploy con `LambdaCanary10Percent5Minutes` / `10Percent10Minutes` / `10Percent15Minutes` / `10Percent30Minutes`. Configurar alarmas de CloudWatch en DeploymentGroup.

Referencia

Despliegue gradual de Lambda en incrementos iguales.

`LambdaLinear10PercentEvery1Minute` / `2Minutes` / `3Minutes` / `10Minutes`. Cada incremento desvía +10% hasta alcanzar el 100%.

Referencia

Despliegue blue/green para un servicio ECS detrás de un ALB.

CodeDeploy Compute Platform = ECS. Crea un conjunto de tareas verde; ALB cambia el oyente al grupo de destino verde; aprobación manual opcional antes del cambio de tráfico y antes de terminar el azul.

Referencia

Actualizar una flota de EC2 sin tiempo de inactividad de toda la flota.

Despliegue in situ con configuraciones `OneAtATime` / `HalfAtATime` / `AllAtOnce`. Los hooks de Auto Scaling Group pausan los lanzamientos de nuevas instancias durante el despliegue.

Referencia

Alojar repositorios Git dentro de AWS con acceso controlado por IAM.

CodeCommit. Autenticación: claves SSH por usuario IAM, credenciales Git HTTPS por usuario IAM, o ayudante de credenciales de AWS CLI. Activadores vía SNS / Lambda en push.

Referencia

Elegir una herramienta IaC para una aplicación sin servidor.

CDK: lenguajes de programación (TS/Python/Java/Go/.NET), constructos de aplicación completos, patrones de múltiples recursos. SAM: extensión YAML de CFN, centrada en sin servidor, más simple. Ambos compilan a CloudFormation.

Referencia

Definir un stack de Lambda + API Gateway + DynamoDB con YAML mínimo.

`Transform: AWS::Serverless-2016-10-31`. Recursos: `AWS::Serverless::Function`, `Api`, `SimpleTable`. `sam build` → `sam deploy --guided`.

Referencia

Estructurar el código de la aplicación CDK.

`App` contiene uno o más `Stack`s. Cada Stack contiene constructos (L1/L2/L3). `cdk synth` → plantilla CFN. `cdk deploy` despliega vía CFN.

Referencia

Elegir nivel de constructo CDK.

L1 = CFN puro (`CfnXxx`). L2 = wrappers curados con valores predeterminados seguros (más común). L3 = patrones que combinan múltiples recursos para arquitecturas completas (por ejemplo, `LambdaRestApi`).

Referencia

Previsualizar cambios antes de aplicarlos a un stack de CloudFormation.

`create-change-set` → revisar JSON de adiciones/modificaciones/reemplazos → `execute-change-set`. Las acciones de reemplazo causan la recreación del recurso.

Referencia

La actualización del stack falla a mitad de camino.

CloudFormation revierte automáticamente a menos que `DisableRollback` sea verdadero. ¿Atascado en `UPDATE_ROLLBACK_FAILED`? Usar `ContinueUpdateRollback` con `ResourcesToSkip`.

Referencia

Prevenir la actualización accidental de un recurso crítico (por ejemplo, RDS DB) durante las actualizaciones del stack.

Política de stack: JSON que deniega `Update:Replace` y `Update:Delete` en el ID lógico del recurso. Saltar con anulación explícita en una actualización específica.

Referencia

Reutilizar infraestructura entre stacks.

Stacks anidados (`AWS::CloudFormation::Stack` con `TemplateURL`) para reutilización propiedad de un padre. Cross-stack vía Outputs + `Fn::ImportValue` para acoplamiento más estrecho entre stacks separados.

Referencia

Inyectar un valor de Parameter Store o un secreto de Secrets Manager en una plantilla CFN.

`{{resolve:ssm:/path/to/param}}`, `{{resolve:ssm-secure:/path}}`, `{{resolve:secretsmanager:secret-id:SecretString:json-key}}`. Resuelto en tiempo de despliegue.

Referencia

Elegir política de despliegue de Elastic Beanstalk.

Todo a la vez (más rápido, tiempo de inactividad), Rolling (sin instancias extra, capacidad parcial), Rolling con lote adicional (sin pérdida de capacidad, costo extra), Inmutable (nuevo ASG, más seguro), Blue/Green (entorno separado, swap CNAMEs).

Referencia

Personalizar el entorno de Elastic Beanstalk (paquetes, archivos, comandos de contenedor).

YAML `.ebextensions/*.config` en el paquete fuente. Plataformas más nuevas: scripts de shell `.platform/hooks/...` para el ciclo de vida prebuild/predeploy/postdeploy.

Referencia

Necesita un artefacto Lambda estable y nunca mutable.

Publicar una versión numerada. Código + la mayoría de la configuración (memoria, tiempo de espera, variables de entorno, capas) se congelan. `$LATEST` es mutable; las versiones numeradas no lo son.

Referencia

Empujar una imagen Docker a ECR para ECS / EKS / Lambda.

`aws ecr get-login-password | docker login` → `docker tag` → `docker push`. Imágenes de contenedor Lambda: la imagen se extrae una vez al desplegar; la imagen etiquetada debe estar en la misma región.

Referencia

Ejecutar un trabajo por lotes único vs un servicio web de larga duración en ECS.

RunTask = una sola tarea, se completa y sale. Servicio = mantiene N tareas deseadas, reinicia fallos, se integra con ALB/NLB.

Referencia

Reducir el costo de cómputo para cargas de trabajo ECS tolerantes a fallos.

Proveedor de capacidad Fargate Spot. Mezclar con Fargate regular a través de pesos y base. Las tareas pueden ser interrumpidas con un aviso de 2 minutos.

Referencia

Resolución de problemas y optimización

Rastrear una solicitud que se distribuye entre Lambda → DynamoDB → HTTP externo.

Segmentos de X-Ray por salto de servicio, subsegmentos para llamadas descendentes. El mapa de servicio visualiza la topología + latencia. Las reglas de muestreo limitan el volumen.

Referencia

Adjuntar datos buscables vs datos de referencia a un rastreo de X-Ray.

Anotaciones: indexadas, filtrables en la consola (por ejemplo, `customerId`, `tier`). Metadatos: no indexados, de forma libre (cuerpo de la solicitud, cuerpo de la respuesta para depuración).

Referencia

El costo de X-Ray es alto en producción.

Regla de muestreo personalizada. Predeterminado: las primeras 1 solicitud/s + 5% adicionales. Las reglas coinciden por servicio / ruta URL / método.

Referencia

Consultar logs de Lambda para errores en la última hora, agrupados por cubo de 5 minutos.

CloudWatch Logs Insights: `fields @timestamp, @message | filter @message like /ERROR/ | stats count() by bin(5m)`.

Referencia

Generar una métrica personalizada a partir de un patrón de log (por ejemplo, recuento de `OutOfMemoryError`).

Filtro de métricas en el grupo de logs. El patrón coincide con los eventos de log; el filtro crea una métrica personalizada de CloudWatch sobre la cual se puede configurar una alarma.

Referencia

Emitir métricas personalizadas desde Lambda sin una llamada a la API `PutMetricData` separada.

Formato de métrica incrustada (Embedded Metric Format): escribir JSON estructurado en stdout; CloudWatch analiza los logs y crea métricas. Más barato y asíncrono.

Por qué: Desacopla la ruta de la métrica de la ruta de la solicitud; sin latencia de API ni permiso IAM adicional.

Referencia

La aplicación emite métricas personalizadas de alta resolución cada segundo.

`PutMetricData` con `StorageResolution=1` para granularidad de 1 segundo. La resolución estándar es de 60 segundos; la alta resolución cuesta más.

Referencia

Los arranques en frío de Lambda afectan los objetivos de latencia p99.

Concurrencia Aprovisionada para carga predecible. SnapStart para código Java/Python con inicialización pesada. Dependencias ligeras, usar ARM/Graviton, mover la inicialización pesada fuera del handler.

Referencia

Elegir la memoria de Lambda para el mejor costo/latencia.

La memoria también escala CPU + red. Usar la máquina de estados AWS Lambda Power Tuning para barrer la memoria y encontrar el punto óptimo para su carga de trabajo.

Referencia

Invocación de Lambda larga alcanza el límite estricto de 15 minutos.

Descomponer en Step Functions; descargar a Fargate (larga duración) o Batch (HPC). El máximo de Lambda es de 900 segundos; no negociable.

Referencia

`TooManyRequestsException` de Lambda; se alcanzó el límite de concurrencia.

Concurrencia reservada por función (límites + reservas) o solicitar un aumento de límite a nivel de cuenta. Las invocaciones asíncronas se encolan y reintentan; las invocaciones síncronas dan error.

Referencia

DynamoDB devuelve `ProvisionedThroughputExceededException`.

CloudWatch `WriteThrottleEvents` / `ReadThrottleEvents`. Cambiar al modo On-Demand, aumentar la capacidad aprovisionada o arreglar una partición caliente con un mejor diseño de clave.

Referencia

Una clave de partición recibe tráfico desproporcionado; limitación bajo baja carga agregada.

Rediseñar la clave de partición con alta cardinalidad. Para escrituras: prefijar con shard aleatorio (por ejemplo, `shard#user`); para lecturas: dispersar-recolectar entre shards.

Referencia

Necesita latencia de lectura de DynamoDB de microsegundos sin cambiar la lógica de la aplicación.

Clúster DAX + SDK DAX como reemplazo directo del SDK de DynamoDB. Las lecturas se sirven desde la caché en memoria; las escrituras se escriben en la tabla.

Referencia

Elegir estrategia de caché para ElastiCache / DAX.

Carga perezosa (fallo de caché → BD → poblar caché): solo almacena en caché los datos solicitados, pero propenso a la desactualización. Escritura a través (escribir en caché + BD en cada escritura): siempre fresco, pero las escrituras tienen un costo adicional. El TTL limita la desactualización en ambos casos.

Referencia

API Gateway devuelve 429 Too Many Requests.

Nivel de cuenta predeterminado: 10,000 solicitudes/seg + 5,000 de ráfaga. Anulaciones por etapa y por método; limitación por clave a través de Planes de Uso para control de nivel de socio.

Referencia

Errores transitorios del servicio AWS durante el tráfico pesado.

El SDK de AWS reintenta automáticamente con retroceso exponencial + jitter. Configurar `RetryMode = adaptive` o `standard`; ajustar `maxAttempts`.

Referencia

CloudFront sirve contenido obsoleto después de un despliegue.

Invalidar rutas (`/index.html`, `/*`) — se factura por ruta más allá de 1000/mes gratis. Mejor: nombres de archivo versionados (`app.abc123.js`) para que la caché se omita naturalmente.

Referencia

Desarrollo con Servicios de AWS

Objetivo de invocación estable mientras se sube nuevo código Lambda.

Publicar versiones numeradas e inmutables; exponer un alias que apunte a una versión. Los llamadores invocan el ARN del alias.

Por qué: Las versiones son instantáneas congeladas de código + configuración; los alias proporcionan indirección para que los llamadores nunca invoquen `$LATEST` directamente.

Referencia

Despliegue gradual de una nueva versión Lambda con rollback automático en caso de errores.

Alias con enrutamiento de versiones ponderado (por ejemplo, 90/10). CodeDeploy `LambdaCanary10Percent5Minutes` o `LambdaLinear*` desplaza el tráfico y monitorea las alarmas de CloudWatch.

Por qué: El desplazamiento de tráfico incorporado + el rollback impulsado por alarmas elimina la lógica canary codificada a mano.

Referencia

Inyectar configuración (URL de BD, indicadores de funciones) sin volver a desplegar.

Variables de entorno de Lambda. Cifradas en reposo con KMS; referenciar una CMK personalizada para cifrado adicional en tránsito en el momento de la recuperación.

Referencia

Compartir NumPy / pandas / runtime común entre muchas Lambdas.

Empaquetar como una capa Lambda; hasta 5 capas por función, 250 MB en total sin comprimir. ARN versionado por capa.

Referencia

Lambda síncrona sensible a la latencia — no se permiten arranques en frío.

Concurrencia aprovisionada en el alias. Preinicializa N entornos de ejecución; se paga por GB-segundo.

Por qué: Elimina el arranque en frío a un costo predecible. Configure el autoescalado de la aplicación en el alias para ajustarse a la carga.

Referencia

Lambda de Java o Python con código de inicialización pesado; necesita un arranque en frío rápido sin pagar por la Concurrencia Aprovisionada.

Habilitar SnapStart en una versión publicada. AWS toma instantáneas del runtime inicializado y se reanuda desde ellas.

Por qué: Gratis para Java; se cobra por restauración para Python/.NET. Reduce los arranques en frío de segundos a <1s sin costo por inactividad.

Referencia

Lambda necesita consumir un stream de Kinesis / DynamoDB Stream / cola SQS / tópico MSK.

Mapeo de origen de evento (basado en pull). Lambda sondea; el tamaño de lote + la ventana de lotes máxima ajustan el rendimiento vs la latencia. Fallo → DLQ a través del destino On-Failure.

Por qué: Para fuentes pull, el servicio no puede invocar Lambda directamente; el mapeo es el adaptador de sondeo de Lambda.

Referencia

Enrutamiento de éxito/fallo de Lambda asíncrono sin DLQ de Lambda.

Destinos OnSuccess / OnFailure en la función. Destinos: SNS, SQS, EventBridge, otra Lambda. Incluye el contexto de invocación.

Por qué: Los destinos capturan el evento completo + respuesta; el DLQ heredado solo captura el payload del evento.

Referencia

Elegir tipo de API Gateway para una nueva API REST.

Por qué: Por defecto, use HTTP API a menos que necesite una característica exclusiva de REST. Las API WebSocket son un producto separado para tiempo real con estado.

Referencia

Promover cambios de API de dev → test → prod sin volver a desplegar APIs separadas.

Etapas en una sola API. Despliegue una etapa para publicar; las variables de etapa contienen valores específicos del entorno, como nombres de alias de Lambda.

Referencia

La Lambda de backend espera una forma diferente a la que envía el cliente.

Plantilla de mapeo de solicitud/respuesta (solo REST API). VTL con `$input`, `$context`, `$util` para transformar JSON.

Por qué: Las plantillas de mapeo se ejecutan en API Gateway — sin salto adicional a Lambda, sin latencia o costo extra.

Referencia

Validar un token personalizado (no Cognito, no IAM) antes de enrutar la solicitud.

Autorizador Lambda. El tipo TOKEN lee un encabezado; el tipo REQUEST lee el contexto completo de la solicitud. Devuelve política IAM + principalId. Cacheado por identidad para TTL.

Referencia

Validar un JWT de Cognito User Pool en cada solicitud.

Autorizador de Cognito User Pool (REST) o autorizador JWT (HTTP). API Gateway valida el token; no se necesita Lambda.

Por qué: La validación nativa es más barata y rápida que un autorizador Lambda para el caso común de JWT.

Referencia

Controlar/limitar a un consumidor de API asociado.

Plan de Uso + Clave de API. El plan vincula las claves a una etapa con límite de tasa (solicitudes/seg) + ráfaga + cuota (solicitudes/día o mes).

Referencia

Reducir la carga del backend para solicitudes GET repetidas.

Caché a nivel de etapa (REST API). TTL configurable; clave de caché derivada de método + ruta + parámetros de consulta/encabezado seleccionados.

Referencia

Actualizar un ítem solo si se cumple una precondición (por ejemplo, status == "PENDING").

PutItem/UpdateItem con `ConditionExpression`. El fallo genera `ConditionalCheckFailedException`.

Por qué: La verificación del lado del servidor evita condiciones de carrera de lectura-modificación-escritura sin bloqueo.

Referencia

Todo o nada entre múltiples ítems de DynamoDB.

`TransactWriteItems` / `TransactGetItems`. Hasta 100 ítems / 4 MB; 2 veces el costo de WCU/RCU de escrituras/lecturas normales.

Referencia

Incrementar un contador sin lectura-modificación-escritura.

UpdateExpression `ADD count :inc`. El servidor aplica el delta atómicamente.

Referencia

Iterar un gran conjunto de resultados de consulta/escaneo.

`LastEvaluatedKey` de la respuesta → `ExclusiveStartKey` en la siguiente llamada hasta que esté ausente. Limitar vía parámetro `Limit`.

Referencia

Necesita un patrón de acceso adicional más allá de la clave primaria.

Referencia

Indexar solo ítems que tienen un atributo particular (por ejemplo, solo órdenes ACTIVE).

Índice disperso: omita el atributo en los ítems que desea excluir. Los ítems sin el atributo indexado no aparecen en el GSI/LSI.

Referencia

Lectura/escritura masiva de muchos ítems.

`BatchGetItem` (hasta 100 ítems / 16 MB) y `BatchWriteItem` (hasta 25 ítems / 16 MB). No atómico; fallos parciales devueltos en `UnprocessedItems`.

Referencia

Prevenir actualizaciones perdidas por escritores concurrentes.

Atributo de versión + `ConditionExpression: version = :v`. Las escrituras fallidas se reintentan releyendo.

Referencia

Activar acciones posteriores en cada cambio de DynamoDB.

DynamoDB Streams + mapeo de origen de eventos de Lambda. Vista de stream: NEW_IMAGE / OLD_IMAGE / NEW_AND_OLD_IMAGES / KEYS_ONLY.

Referencia

El navegador sube/descarga directamente a S3 sin que su servidor haga proxy de bytes.

SDK `getSignedUrl` para GET o PUT. Expiración de hasta 7 días cuando se firma por usuario IAM (sigv4); más corta para sesiones derivadas de roles.

Por qué: Descarga ancho de banda de su backend; la URL es una capacidad temporal limitada a un objeto + método.

Referencia

Subir un archivo grande (≫100 MB) de forma fiable desde el SDK.

`CreateMultipartUpload` → `UploadPart` en paralelo → `CompleteMultipartUpload`. El gestor de transferencias de alto nivel del SDK maneja el tamaño de las partes automáticamente.

Referencia

Ejecutar código cuando se crea/elimina un objeto en S3.

S3 Event Notifications → Lambda / SNS / SQS / EventBridge. Filtrar por prefijo y sufijo.

Referencia

La aplicación del navegador obtiene datos de S3 a través de orígenes (`fetch('https://bucket.s3...')`); la pre-solicitud CORS falla.

Configurar reglas CORS del bucket: orígenes permitidos, métodos (GET/PUT), encabezados y encabezados expuestos.

Referencia

Filtrar filas de un objeto CSV/JSON/Parquet de 50 GB sin descargarlo.

S3 Select con SQL. Devuelve solo las filas coincidentes; se paga por el escaneo + los bytes devueltos.

Referencia

Iniciar sesión de un usuario desde un cliente móvil/web público sin enviar la contraseña.

Cognito User Pool con flujo `USER_SRP_AUTH`. El cliente calcula la prueba SRP; el backend nunca ve la contraseña. Devuelve tokens de ID + acceso + actualización.

Referencia

Usuario federado (Google/Apple/Cognito UP) necesita credenciales temporales de AWS para llamar directamente a las API de AWS desde una aplicación móvil.

Cognito Identity Pool. Intercambia token de proveedor de identidad → rol IAM → credenciales temporales de AWS vía STS.

Por qué: Los User Pools autentican usuarios; los Identity Pools los autorizan a recursos de AWS.

Referencia

Elegir un tipo de flujo de trabajo de Step Functions.

Referencia

Un paso del flujo de trabajo falla; quiere reintento con retroceso y enrutamiento a un estado de recuperación.

Referencia

Aplicar el mismo flujo de trabajo a cada ítem en una matriz, con límite de concurrencia.

Estado Map con `ItemsPath` y `MaxConcurrency`. Distributed Map maneja más de 10k ítems con entrada respaldada por S3.

Referencia

Activar Lambda en un horario cron o al coincidir eventos entrantes.

Regla de EventBridge. Programación: `rate(...)` o `cron(...)`. Patrón: filtro de eventos JSON; coincide con fuente, tipo de detalle, campos de detalle.

Referencia

Enrutar eventos de SQS / Kinesis / DynamoDB Streams / MSK a un destino con filtro + transformación opcionales.

EventBridge Pipes. Origen → Filtro → Enriquecimiento (Lambda/Step Functions) → Destino. No se necesita Lambda para los casos simples.

Referencia

Procesar mensajes estrictamente en orden por cliente, con deduplicación.

Cola SQS FIFO. `MessageGroupId` particiona el ordenamiento (paralelismo por grupo); `MessageDeduplicationId` (o deduplicación basada en contenido) elimina duplicados en 5 minutos.

Referencia

El consumidor extrae un mensaje pero falla antes de eliminarlo.

Mensaje oculto durante VisibilityTimeout segundos, luego reaparece para reentrega. Ajustar al tiempo de procesamiento más largo esperado + buffer.

Por qué: Demasiado corto → procesamiento duplicado. Demasiado largo → recuperación lenta en caso de fallo. ChangeMessageVisibility extiende el tiempo en tránsito si es necesario.

Referencia

Ajustar la capacidad de Kinesis Data Streams para el rendimiento de escritura.

Cada shard = 1 MB/s o 1000 registros/s de entrada, 2 MB/s de salida. Añadir shards (dividir) o usar el modo On-Demand para autoescalado.

Referencia

Seguridad

El código en EC2 / tarea ECS / Lambda necesita acceso a AWS — sin claves embebidas.

Adjuntar un rol IAM vía perfil de instancia (EC2) o rol de tarea/ejecución (ECS/Lambda). El SDK obtiene credenciales temporales del servicio de metadatos; se auto-rota.

Referencia

Acceso entre cuentas desde el código de la aplicación o la CLI.

`sts:AssumeRole` desde el principal del llamador. La política de confianza del rol de destino enumera al llamador como `Principal`. Devuelve credenciales temporales (máximo 12 horas).

Referencia

AssumeRole entre cuentas está fallando — el permiso parece correcto.

Por qué: Confianza = quién puede asumir. Permiso = qué pueden hacer una vez asumido. Cualquiera que falte → AccessDenied.

Referencia

Política que otorga a los usuarios acceso solo a su propia carpeta en S3.

Usar `${aws:username}` o `${aws:PrincipalTag/X}` en los ARNs de recursos: `arn:aws:s3:::bucket/${aws:username}/*`.

Referencia

Permitir que un equipo autogestione roles IAM, pero limitar los permisos que pueden otorgar.

Política de límites de permisos en el rol creador del equipo. Cualquier rol que creen con el límite tendrá la intersección de la política de identidad + el límite como permisos efectivos.

Referencia

Restringir una acción por IP de origen / VPC / región / MFA.

`Condition` de política: `aws:SourceIp`, `aws:SourceVpc`, `aws:SourceVpce`, `aws:RequestedRegion`, `aws:MultiFactorAuthPresent`.

Referencia

Cliente SPA / móvil vs servicio de lado del servidor llamando a Cognito.

Referencia

Distinguir token de ID de Cognito vs token de Acceso vs token de Actualización.

Referencia

UI de inicio de sesión/registro lista para usar sin construir formularios.

Cognito Hosted UI. Flujo de código de autorización OAuth2: redirigir a `/oauth2/authorize` → URL de callback con `code` → intercambiar en `/oauth2/token`.

Referencia

Cifrar un secreto pequeño (≤4 KB) directamente con KMS.

`kms:Encrypt` devuelve un blob de texto cifrado que contiene el ARN de la clave. `kms:Decrypt` recupera el texto plano si el llamador tiene permiso y (si se especifica) `EncryptionContext` coincide.

Referencia

Cifrar grandes cantidades de datos con KMS sin alcanzar el límite de cifrado directo de 4 KB.

Cifrado de envolvente. `GenerateDataKey` devuelve DEK en texto plano + cifrado; cifrar datos localmente con DEK, almacenar DEK cifrado junto, descartar DEK en texto plano.

Por qué: KMS aplica control de acceso en el DEK pequeño; el cifrado masivo ocurre localmente a velocidad de línea.

Referencia

Otorgar a otro principal acceso limitado en el tiempo a una CMK sin editar la política de clave.

Crear una concesión `kms:CreateGrant` que delimita las operaciones + el concesionario. Revocar con `RetireGrant`.

Referencia

Referenciar una clave KMS indirectamente para que la CMK subyacente pueda rotar sin cambios en el código.

Usar `alias/my-key` (o `arn:aws:kms:region:acct:alias/my-key`). Actualizar el alias para que apunte a una nueva CMK; los consumidores siguen funcionando.

Referencia

Elegir un almacén de credenciales.

Referencia

Rotar credenciales de RDS automáticamente.

Rotación nativa de Secrets Manager (Lambda gestionada) para Aurora/RDS/DocumentDB/Redshift. El patrón maestro/usuario utiliza un secreto maestro separado para rotar el secreto de usuario.

Referencia

Almacenar un valor de configuración con cifrado KMS en reposo en Parameter Store.

Tipo de parámetro SecureString. Especificar `--key-id` para una CMK personalizada; de lo contrario, usa `aws/ssm`. El descifrado requiere `kms:Decrypt` en la CMK.

Referencia

Restringir el acceso a CloudFront a usuarios autenticados.

URLs firmadas (recurso único) o cookies firmadas (múltiples recursos, SPAs/streaming). Firmar con un par de claves de CloudFront almacenado como clave pública en el grupo de claves de CloudFront.

Referencia

Elegir cifrado del lado del servidor de S3.

Referencia

Encontrar roles/políticas que otorgan acceso fuera de la cuenta o son demasiado permisivas.

IAM Access Analyzer. Hallazgos sobre acceso externo; generación de políticas a partir del historial de CloudTrail para el dimensionamiento de privilegios mínimos.

Referencia

La variable de entorno de Lambda contiene un valor sensible.

Referencia

El navegador → API Gateway con encabezado `Authorization` es bloqueado por pre-solicitud.

Añadir método OPTIONS (integración simulada). Permitir `Authorization` en `Access-Control-Allow-Headers`; permitir llamadores en `Access-Control-Allow-Origin`.

Referencia

Firmar una solicitud HTTP personalizada a un servicio de AWS desde código que no es SDK.

Sigv4: derivar clave de firma de secreto + fecha + región + servicio; canonicar solicitud; firmar; añadir encabezados `Authorization`, `X-Amz-Date`, `X-Amz-Security-Token`.

Referencia

Asumir un rol amplio pero limitar el alcance para una sesión específica.

`AssumeRole` con `Policy` (política de sesión en línea) restringe aún más los permisos efectivos: intersección de rol + política de sesión.

Referencia

Acceso a S3 denegado a pesar de que la política IAM lo permite.

Referencia

Implementación

Construir un pipeline CI/CD: fuente → construcción → prueba → despliegue con aprobación manual de producción.

Etapas de CodePipeline, cada una con una o más acciones. Acción de Aprobación Manual entre Prueba y Despliegue. Fuente = CodeCommit / GitHub / S3 / ECR.

Referencia

Definir pasos de construcción para CodeBuild.

Referencia

Desviar el tráfico de Lambda 10% y luego 100% con rollback automático en caso de alarmas.

CodeDeploy con `LambdaCanary10Percent5Minutes` / `10Percent10Minutes` / `10Percent15Minutes` / `10Percent30Minutes`. Configurar alarmas de CloudWatch en DeploymentGroup.

Referencia

Despliegue gradual de Lambda en incrementos iguales.

`LambdaLinear10PercentEvery1Minute` / `2Minutes` / `3Minutes` / `10Minutes`. Cada incremento desvía +10% hasta alcanzar el 100%.

Referencia

Despliegue blue/green para un servicio ECS detrás de un ALB.

Referencia

Actualizar una flota de EC2 sin tiempo de inactividad de toda la flota.

Despliegue in situ con configuraciones `OneAtATime` / `HalfAtATime` / `AllAtOnce`. Los hooks de Auto Scaling Group pausan los lanzamientos de nuevas instancias durante el despliegue.

Referencia

Alojar repositorios Git dentro de AWS con acceso controlado por IAM.

CodeCommit. Autenticación: claves SSH por usuario IAM, credenciales Git HTTPS por usuario IAM, o ayudante de credenciales de AWS CLI. Activadores vía SNS / Lambda en push.

Referencia

Elegir una herramienta IaC para una aplicación sin servidor.

Referencia

Definir un stack de Lambda + API Gateway + DynamoDB con YAML mínimo.

`Transform: AWS::Serverless-2016-10-31`. Recursos: `AWS::Serverless::Function`, `Api`, `SimpleTable`. `sam build` → `sam deploy --guided`.

Referencia

Estructurar el código de la aplicación CDK.

`App` contiene uno o más `Stack`s. Cada Stack contiene constructos (L1/L2/L3). `cdk synth` → plantilla CFN. `cdk deploy` despliega vía CFN.

Referencia

Elegir nivel de constructo CDK.

Referencia

Previsualizar cambios antes de aplicarlos a un stack de CloudFormation.

`create-change-set` → revisar JSON de adiciones/modificaciones/reemplazos → `execute-change-set`. Las acciones de reemplazo causan la recreación del recurso.

Referencia

La actualización del stack falla a mitad de camino.

CloudFormation revierte automáticamente a menos que `DisableRollback` sea verdadero. ¿Atascado en `UPDATE_ROLLBACK_FAILED`? Usar `ContinueUpdateRollback` con `ResourcesToSkip`.

Referencia

Prevenir la actualización accidental de un recurso crítico (por ejemplo, RDS DB) durante las actualizaciones del stack.

Política de stack: JSON que deniega `Update:Replace` y `Update:Delete` en el ID lógico del recurso. Saltar con anulación explícita en una actualización específica.

Referencia

Reutilizar infraestructura entre stacks.

Referencia

Inyectar un valor de Parameter Store o un secreto de Secrets Manager en una plantilla CFN.

`{{resolve:ssm:/path/to/param}}`, `{{resolve:ssm-secure:/path}}`, `{{resolve:secretsmanager:secret-id:SecretString:json-key}}`. Resuelto en tiempo de despliegue.

Referencia

Elegir política de despliegue de Elastic Beanstalk.

Referencia

Personalizar el entorno de Elastic Beanstalk (paquetes, archivos, comandos de contenedor).

YAML `.ebextensions/*.config` en el paquete fuente. Plataformas más nuevas: scripts de shell `.platform/hooks/...` para el ciclo de vida prebuild/predeploy/postdeploy.

Referencia

Necesita un artefacto Lambda estable y nunca mutable.

Referencia

Empujar una imagen Docker a ECR para ECS / EKS / Lambda.

Referencia

Ejecutar un trabajo por lotes único vs un servicio web de larga duración en ECS.

RunTask = una sola tarea, se completa y sale. Servicio = mantiene N tareas deseadas, reinicia fallos, se integra con ALB/NLB.

Referencia

Reducir el costo de cómputo para cargas de trabajo ECS tolerantes a fallos.

Proveedor de capacidad Fargate Spot. Mezclar con Fargate regular a través de pesos y base. Las tareas pueden ser interrumpidas con un aviso de 2 minutos.

Referencia

Resolución de problemas y optimización

Rastrear una solicitud que se distribuye entre Lambda → DynamoDB → HTTP externo.

Segmentos de X-Ray por salto de servicio, subsegmentos para llamadas descendentes. El mapa de servicio visualiza la topología + latencia. Las reglas de muestreo limitan el volumen.

Referencia

Adjuntar datos buscables vs datos de referencia a un rastreo de X-Ray.

Anotaciones: indexadas, filtrables en la consola (por ejemplo, `customerId`, `tier`). Metadatos: no indexados, de forma libre (cuerpo de la solicitud, cuerpo de la respuesta para depuración).

Referencia

El costo de X-Ray es alto en producción.

Regla de muestreo personalizada. Predeterminado: las primeras 1 solicitud/s + 5% adicionales. Las reglas coinciden por servicio / ruta URL / método.

Referencia

Consultar logs de Lambda para errores en la última hora, agrupados por cubo de 5 minutos.

CloudWatch Logs Insights: `fields @timestamp, @message | filter @message like /ERROR/ | stats count() by bin(5m)`.

Referencia

Generar una métrica personalizada a partir de un patrón de log (por ejemplo, recuento de `OutOfMemoryError`).

Filtro de métricas en el grupo de logs. El patrón coincide con los eventos de log; el filtro crea una métrica personalizada de CloudWatch sobre la cual se puede configurar una alarma.

Referencia

Emitir métricas personalizadas desde Lambda sin una llamada a la API `PutMetricData` separada.

Formato de métrica incrustada (Embedded Metric Format): escribir JSON estructurado en stdout; CloudWatch analiza los logs y crea métricas. Más barato y asíncrono.

Por qué: Desacopla la ruta de la métrica de la ruta de la solicitud; sin latencia de API ni permiso IAM adicional.

Referencia

La aplicación emite métricas personalizadas de alta resolución cada segundo.

`PutMetricData` con `StorageResolution=1` para granularidad de 1 segundo. La resolución estándar es de 60 segundos; la alta resolución cuesta más.

Referencia

Los arranques en frío de Lambda afectan los objetivos de latencia p99.

Referencia

Elegir la memoria de Lambda para el mejor costo/latencia.

La memoria también escala CPU + red. Usar la máquina de estados AWS Lambda Power Tuning para barrer la memoria y encontrar el punto óptimo para su carga de trabajo.

Referencia

Invocación de Lambda larga alcanza el límite estricto de 15 minutos.

Descomponer en Step Functions; descargar a Fargate (larga duración) o Batch (HPC). El máximo de Lambda es de 900 segundos; no negociable.

Referencia

`TooManyRequestsException` de Lambda; se alcanzó el límite de concurrencia.

Referencia

DynamoDB devuelve `ProvisionedThroughputExceededException`.

CloudWatch `WriteThrottleEvents` / `ReadThrottleEvents`. Cambiar al modo On-Demand, aumentar la capacidad aprovisionada o arreglar una partición caliente con un mejor diseño de clave.

Referencia

Una clave de partición recibe tráfico desproporcionado; limitación bajo baja carga agregada.

Rediseñar la clave de partición con alta cardinalidad. Para escrituras: prefijar con shard aleatorio (por ejemplo, `shard#user`); para lecturas: dispersar-recolectar entre shards.

Referencia

Necesita latencia de lectura de DynamoDB de microsegundos sin cambiar la lógica de la aplicación.

Clúster DAX + SDK DAX como reemplazo directo del SDK de DynamoDB. Las lecturas se sirven desde la caché en memoria; las escrituras se escriben en la tabla.

Referencia

Elegir estrategia de caché para ElastiCache / DAX.

Referencia

API Gateway devuelve 429 Too Many Requests.

Nivel de cuenta predeterminado: 10,000 solicitudes/seg + 5,000 de ráfaga. Anulaciones por etapa y por método; limitación por clave a través de Planes de Uso para control de nivel de socio.

Referencia

Errores transitorios del servicio AWS durante el tráfico pesado.

El SDK de AWS reintenta automáticamente con retroceso exponencial + jitter. Configurar `RetryMode = adaptive` o `standard`; ajustar `maxAttempts`.

Referencia

CloudFront sirve contenido obsoleto después de un despliegue.

Invalidar rutas (`/index.html`, `/*`) — se factura por ruta más allá de 1000/mes gratis. Mejor: nombres de archivo versionados (`app.abc123.js`) para que la caché se omita naturalmente.

Referencia