Plataforma global de e-commerce que requiere transacciones ACID, fuerte consistencia y 99.999% de disponibilidad en múltiples continentes.
→Cloud Spanner con una configuración multirregional (p. ej., nam-eur-asia).
Por qué: Spanner es el único servicio administrado de GCP que proporciona transacciones ACID globalmente distribuidas y fuertemente consistentes a escala con un SLA del 99.999%.
Referencia↗
Migrar una base de datos Oracle OLTP grande y de alto rendimiento con procedimientos almacenados complejos y necesidades de consultas analíticas.
→AlloyDB para PostgreSQL.
Por qué: AlloyDB ofrece un rendimiento superior de PostgreSQL, características de compatibilidad con Oracle y un motor columnar para acelerar las consultas analíticas (HTAP) sin afectar las cargas de trabajo transaccionales.
Referencia↗
Ingesta de datos de series temporales de alto rendimiento (millones de OPS) (p. ej., IoT, registros) que requiere lecturas de baja latencia y expiración automática de datos.
→Cloud Bigtable con un diseño de clave de fila de `(entity_id)#(reverse_timestamp)` y una política de recolección de basura.
Por qué: Bigtable está diseñado para cargas de trabajo clave/valor masivas y de baja latencia. Una marca de tiempo inversa en la clave de fila co-ubica datos recientes para escaneos eficientes. La recolección de basura maneja el TTL.
Referencia↗
Aplicación móvil o web que requiere un esquema flexible, sincronización de datos en tiempo real con los clientes y soporte fuera de línea.
→Firestore en modo nativo.
Por qué: Firestore está diseñado específicamente para este patrón de backend de aplicación sin servidor, proporcionando oyentes en tiempo real y persistencia fuera de línea a través de sus SDK de cliente de forma predeterminada.
Referencia↗
Búsqueda de similitud a gran escala (más de 10 millones de vectores) para aplicaciones de IA/ML (p. ej., RAG, recomendaciones) que necesitan una latencia inferior a 100 ms.
→AlloyDB para PostgreSQL con extensión pgvector y un índice ScaNN.
Por qué: AlloyDB integra el algoritmo ScaNN de alto rendimiento de Google para la búsqueda aproximada del vecino más cercano (ANN), superando las implementaciones estándar de búsqueda vectorial a escala.
Diseñar un esquema de Cloud Spanner para una carga de trabajo con muchas escrituras para evitar puntos críticos en un solo servidor.
→Diseñar claves primarias que no utilicen valores que aumentan monótonamente (p. ej., IDs secuenciales, marcas de tiempo) como la primera parte de la clave. En su lugar, utilice UUIDs, valores hash o secuencias de bits invertidos.
Por qué: Spanner distribuye los datos lexicográficamente por clave primaria. Las claves secuenciales dirigen todas las escrituras a una única división, creando un punto crítico. Las claves distribuidas aleatoriamente distribuyen las escrituras en todas las divisiones.
Referencia↗
Un esquema de Spanner tiene una fuerte relación padre-hijo (p. ej., Clientes y Pedidos) y las consultas frecuentemente recuperan un padre con todos sus hijos.
→Utilizar tablas intercaladas, definiendo la tabla hija con `INTERLEAVE IN PARENT`.
Por qué: El intercalado co-ubica físicamente las filas hijas con su fila padre en el almacenamiento. Esto hace que las uniones padre-hijo sean extremadamente eficientes, ya que se convierte en un escaneo de rango altamente optimizado en una sola división.
Rastreo de ubicaciones en tiempo real para una flota masiva de vehículos (más de 50k escrituras/seg) con consultas para encontrar vehículos dentro de un área geográfica.
→Cloud Bigtable con una clave de fila prefijada por un GeoHash de la ubicación del vehículo.
Por qué: Bigtable maneja el rendimiento de escritura extremo. La codificación GeoHash convierte coordenadas 2D en una cadena 1D donde los prefijos representan la proximidad geográfica, lo que permite escaneos de rango geoespaciales eficientes.
Almacenar y analizar datos a escala de petabytes (p. ej., datos genómicos, registros) con consultas SQL analíticas complejas.
→Almacenar datos sin procesar en Cloud Storage y consultarlos directamente desde BigQuery usando tablas externas, o cargarlos en el almacenamiento nativo de BigQuery.
Por qué: BigQuery es un almacén de datos sin servidor construido para análisis a escala de petabytes. Su separación de almacenamiento y cómputo proporciona un rendimiento de consulta inigualable y rentabilidad para cargas de trabajo OLAP.
Una caché en memoria de alta disponibilidad para estructuras de datos complejas (hashes, conjuntos) con capacidades de pub/sub para invalidación de caché.
→Memorystore para Redis Standard Tier con réplicas de lectura.
Por qué: Standard Tier proporciona un SLA del 99.9% con conmutación por error automática. Redis admite tipos de datos complejos y pub/sub, a diferencia de Memcached. Las réplicas de lectura pueden escalar el rendimiento de lectura.
Diseñar una aplicación SaaS multi-inquilino en Spanner que requiera una fuerte aislamiento de datos y garantías de rendimiento por inquilino.
→Usar tenant_id como primer componente de la clave primaria para todas las tablas. Para un aislamiento más fuerte, usar un modelo de base de datos por inquilino dentro de una única instancia de Spanner.
Por qué: Un prefijo tenant_id co-ubica naturalmente todos los datos de un solo inquilino, optimizando las consultas y permitiendo que Spanner divida los datos por inquilino. La base de datos por inquilino proporciona el aislamiento lógico más fuerte.