Zuletzt überprüft: Mai 2026
Erstellen Sie die AWS-Dienste der GAIL-Prüfung mit reinem Terraform — ein Block nach dem anderen, jeweils abgestimmt auf eine Prüfungsdomäne. Derselbe Code funktioniert auch mit OpenTofu.
Am Ende dieses Labs haben Sie mit einfachem Terraform die kleinste realistische Google GenAI-Grundlage bereitgestellt – Vertex AI- und Discovery Engine-APIs aktiviert, eine Vertex AI Workbench-Instanz für das Prototyping, einen Discovery Engine-Datenspeicher, der die Grundquelle für RAG und Vertex AI Search darstellt, und eine Cloud Monitoring-Benachrichtigung für die Fehlerquote bei Vertex-Vorhersagen. Vier Blöcke; die konzeptionelle GAIL-Landschaft abgebildet auf die tatsächlich bereitgestellte Infrastruktur.
Legen Sie die Snippets in eine einzelne main.tf-Datei, führen Sie terraform init aus und anschließend terraform apply Schritt für Schritt.
>= 1.5 oder OpenTofu >= 1.6.your-project-id im Anbieterblock.Ca. 50 $/Monat, wenn die Workbench 24/7 läuft. Stoppen Sie sie nach jeder Labsitzung.
Aktivieren Sie die APIs für Vertex AI, Discovery Engine (Vertex AI Search), Cloud Notebooks und Cloud Monitoring.
terraform {
required_version = ">= 1.5"
required_providers {
google = { source = "hashicorp/google", version = "~> 6.0" }
}
}
provider "google" {
project = "your-project-id" # REPLACE
region = "us-central1"
}
locals {
labels = {
project = "certlabpro-gail"
managed_by = "terraform"
}
}
resource "google_project_service" "aiplatform" {
service = "aiplatform.googleapis.com"
disable_on_destroy = false
}
resource "google_project_service" "notebooks" {
service = "notebooks.googleapis.com"
disable_on_destroy = false
}
resource "google_project_service" "discoveryengine" {
service = "discoveryengine.googleapis.com"
disable_on_destroy = false
}
resource "google_project_service" "monitoring" {
service = "monitoring.googleapis.com"
disable_on_destroy = false
}Vertex AI Workbench ist die Jupyter-in-the-Cloud-Oberfläche, von der jeder GenAI-Prototyping-Workflow auf GCP ausgeht – vergleichbar mit Amazon SageMaker Studio / Azure ML Workbench. Die GAIL-Prüfung testet dies als das Standard-Tool für Data Scientists.
Wir stellen eine kleine e2-standard-2-Workbench-Instanz bereit, die mit den GenAI Python-Bibliotheken vorinstalliert ist. Die Workbench läuft im Hintergrund auf einer verwalteten Compute Engine VM – Sie werden sie auch in der GCE-Konsole sehen. Stoppen Sie die Instanz über die Vertex AI Workbench-Konsole, wenn Sie sie nicht aktiv nutzen, um Kosten von ca. 50 $/Monat im Leerlauf zu vermeiden.
resource "google_workbench_instance" "main" {
name = "certlabpro-gail-workbench"
location = "us-central1-a"
gce_setup {
machine_type = "e2-standard-2"
boot_disk {
disk_size_gb = 100
disk_type = "PD_STANDARD"
}
}
labels = local.labels
depends_on = [google_project_service.notebooks]
}Discovery Engine (ehemals Vertex AI Search) ist das Vorzeige-RAG-Primitiv der GAIL-Prüfung – richten Sie es auf ein Korpus (GCS-Bucket, Website-Crawling, BigQuery-Dataset oder strukturiertes JSON) aus, es indiziert den Inhalt, und nachfolgende Gemini-Aufrufe können ihre Antworten in diesem Korpus verankern.
Wir erstellen einen Datenspeicher vom Typ GENERIC – den konzeptionellen Container für indizierte Inhalte. Produktionsbereitstellungen füllen den Speicher über die Discovery Engine API mit Dokumenten; für das Lab dient der leere Speicher als Demonstration, dass die Ressource existiert und entsprechend abgerechnet wird.
Die GAIL-Prüfung testet dieses Dreieck aus Datenspeicher → Such-App → verankerte Antworten als die Standardform für Enterprise-RAG-on-GCP.
resource "google_discovery_engine_data_store" "main" {
data_store_id = "certlabpro-gail-store"
display_name = "GAIL lab data store"
location = "global"
industry_vertical = "GENERIC"
content_config = "CONTENT_REQUIRED"
solution_types = ["SOLUTION_TYPE_SEARCH"]
depends_on = [google_project_service.discoveryengine]
}GenAI-Workloads haben eine operationale Dimension, die in der GAIL-Prüfung immer wieder auftaucht: Vorhersagefehler, Latenz, Kosten pro Token. Wir richten eine Cloud Monitoring-Benachrichtigung für die Fehlerquote von Vertex AI-Vorhersagen ein – sie wird ausgelöst, wenn die Fehlerquote über 5 Minuten 5 % überschreitet.
Mit den vier Blöcken (Anbieter + APIs, Workbench für Prototyping, Discovery Engine-Datenspeicher zur Verankerung und eine Cloud Monitoring-Stolperfalle für die operationale Gesundheit) wird die konzeptionelle GAIL-Landschaft auf die tatsächlich bereitgestellte Infrastruktur abgebildet. Echte GenAI-Bereitstellungen legen Model Garden-Auswahlen, benutzerdefiniertes Training, Prompt-Management, Agent Builder und Model Armor / Responsible AI-Steuerungen auf diese Grundlage – aber das obige Substrat ist die Form, die Sie in GAIL-Prüfungsszenarien sehen werden.
resource "google_monitoring_alert_policy" "vertex_prediction_errors" {
display_name = "GAIL lab — Vertex AI prediction error rate"
combiner = "OR"
conditions {
display_name = "Prediction error rate > 5% over 5 minutes"
condition_threshold {
filter = "metric.type=\"aiplatform.googleapis.com/prediction/online/error_count\" AND resource.type=\"aiplatform.googleapis.com/Endpoint\""
duration = "300s"
comparison = "COMPARISON_GT"
threshold_value = 0.05
aggregations {
alignment_period = "60s"
per_series_aligner = "ALIGN_RATE"
}
}
}
# notification_channels = [] # add channels via console or separate TF resource
depends_on = [google_project_service.monitoring]
}terraform destroy reißt alles ab. Die Workbench-Instanz beendet die Abrechnung sofort nach der Zerstörung (ca. 50 $/Monat gespart). Der Discovery Engine-Datenspeicher wird sauber zerstört (keine Mindestgebühr pro Ressource, um die man sich Sorgen machen müsste). Die Überwachungsrichtlinie wird getrennt.
GAIL deckt viele GenAI-on-GCP-Oberflächen ab, die dieses Lab nicht alle behandeln kann – Gemini-Modellauswahl (Gemini Pro / Gemini Flash / Gemini Nano), Vertex AI Model Garden (Anthropic Claude, Meta Llama, Mistral usw.), Vertex AI Agent Builder (No-Code-Agentenbereitstellung), Vertex AI Pipelines (Kubeflow Pipelines + benutzerdefinierte MLOps), Vertex AI Prompt Optimizer, Model Armor / Responsible AI-Tools, Vertex AI Feature Store, AutoML, benutzerdefinierte Trainingsjobs, die gesamte Generative AI Studio-Konsole, BigQuery ML's GenAI-Oberfläche, Workspace GenAI-Funktionen (Hilf mir schreiben / Hilf mir organisieren), Gemini für Google Cloud (der IDE-Assistent) und Vertex AI Search & Conversation App-Bereitstellung (die nächste Ebene über Datenspeichern).
Wir beschränken uns auf die Workbench + Datastore + Monitoring-Primitive, da sie die kleinsten demonstrierbaren Formen sind. Workbench ist der Ort, an dem Sie Prototypen entwickeln. Datastore ist das, was RAG / Vertex AI Search liest. Monitoring ist die Art, wie Sie alles betreiben. Meistern Sie die Grundlage; die übergeordneten Konstrukte (Agenten, Pipelines, Prompts) werden über Vertex AI Studio angeschlossen.
Für eine konzeptionelle Abdeckung Dienst für Dienst siehe die Abschnitte Durchsuchen, Handbuch und Editorial dieser Zertifizierungsseite.