最后审核时间:2026年5月
使用原生 Terraform 构建 GAIL 考试中的 AWS 服务——每次构建一个代码块,并紧扣考试领域。相同的代码可在 OpenTofu 上运行。
在本实验结束时,您将使用纯 Terraform 预置最小的真实 Google GenAI 基础架构——启用 Vertex AI 和 Discovery Engine API,一个用于原型设计的 Vertex AI Workbench 实例,一个作为 RAG 和 Vertex AI Search 的基础来源原语的 Discovery Engine 数据存储,以及一个针对 Vertex 预测错误率的 Cloud Monitoring 警报。四个模块;GAIL 概念性蓝图映射到实际预置的基础设施。
将这些代码片段放入一个 main.tf 文件中,运行 terraform init,然后逐步运行 terraform apply。
>= 1.5 或 OpenTofu >= 1.6。your-project-id。如果 Workbench 24/7 运行,每月约 50 美元。每次实验会话结束后请停止它。
启用 Vertex AI、Discovery Engine (Vertex AI Search)、Cloud Notebooks 和 Cloud Monitoring API。
terraform {
required_version = ">= 1.5"
required_providers {
google = { source = "hashicorp/google", version = "~> 6.0" }
}
}
provider "google" {
project = "your-project-id" # REPLACE
region = "us-central1"
}
locals {
labels = {
project = "certlabpro-gail"
managed_by = "terraform"
}
}
resource "google_project_service" "aiplatform" {
service = "aiplatform.googleapis.com"
disable_on_destroy = false
}
resource "google_project_service" "notebooks" {
service = "notebooks.googleapis.com"
disable_on_destroy = false
}
resource "google_project_service" "discoveryengine" {
service = "discoveryengine.googleapis.com"
disable_on_destroy = false
}
resource "google_project_service" "monitoring" {
service = "monitoring.googleapis.com"
disable_on_destroy = false
}Vertex AI Workbench 是 GCP 上每个 GenAI 原型设计流程都从其开始的云端 Jupyter 界面——相当于 Amazon SageMaker Studio / Azure ML Workbench。GAIL 考试将其作为首选数据科学家工作台原语进行考查。
我们预置一个小型 e2-standard-2 Workbench 实例,其中预加载了 GenAI Python 库。Workbench 在底层作为托管的 Compute Engine 虚拟机运行——您也会在 GCE 控制台中看到它。不活动时,请通过 Vertex AI Workbench 控制台停止实例,以避免闲置时产生每月约 50 美元的费用。
resource "google_workbench_instance" "main" {
name = "certlabpro-gail-workbench"
location = "us-central1-a"
gce_setup {
machine_type = "e2-standard-2"
boot_disk {
disk_size_gb = 100
disk_type = "PD_STANDARD"
}
}
labels = local.labels
depends_on = [google_project_service.notebooks]
}Discovery Engine(前身为 Vertex AI Search)是 GAIL 考试的旗舰级 RAG 原语——将其指向语料库(GCS 存储桶、网站抓取、BigQuery 数据集或结构化 JSON),它会索引内容,下游的 Gemini 调用可以根据该语料库获取答案。
我们创建一个 GENERIC 类型的数据存储——这是索引内容的概念性容器。生产部署通过 Discovery Engine API 向存储添加文档;对于本实验,空的存储只是为了演示该资源存在并会相应计费。
GAIL 考试将这种 数据存储 → 搜索应用 → 基于事实的答案 的三角关系作为标准的 GCP 上的企业级 RAG 模式进行考查。
resource "google_discovery_engine_data_store" "main" {
data_store_id = "certlabpro-gail-store"
display_name = "GAIL lab data store"
location = "global"
industry_vertical = "GENERIC"
content_config = "CONTENT_REQUIRED"
solution_types = ["SOLUTION_TYPE_SEARCH"]
depends_on = [google_project_service.discoveryengine]
}GenAI 工作负载具有 GAIL 考试不断强调的操作维度:预测错误、延迟、每 token 成本。我们为 Vertex AI 的预测错误指标配置了一个 Cloud Monitoring 警报——当错误率在 5 分钟内超过 5% 时触发。
通过四个已就位的模块(提供者+API、用于原型设计的 Workbench、用于基础来源的 Discovery Engine 数据存储,以及用于操作健康的 Cloud Monitoring 触发器),GAIL 概念性蓝图已映射到实际预置的基础设施。真实的 GenAI 部署在此基础上叠加了模型库选择、自定义训练、提示管理、代理构建器以及 Model Armor / 负责任的 AI 控制——但上述基础架构是您将在 GAIL 考试场景中看到的形状。
resource "google_monitoring_alert_policy" "vertex_prediction_errors" {
display_name = "GAIL lab — Vertex AI prediction error rate"
combiner = "OR"
conditions {
display_name = "Prediction error rate > 5% over 5 minutes"
condition_threshold {
filter = "metric.type=\"aiplatform.googleapis.com/prediction/online/error_count\" AND resource.type=\"aiplatform.googleapis.com/Endpoint\""
duration = "300s"
comparison = "COMPARISON_GT"
threshold_value = 0.05
aggregations {
alignment_period = "60s"
per_series_aligner = "ALIGN_RATE"
}
}
}
# notification_channels = [] # add channels via console or separate TF resource
depends_on = [google_project_service.monitoring]
}terraform destroy 会销毁所有资源。Workbench 实例在销毁后会立即停止计费(每月节省约 50 美元)。Discovery Engine 数据存储会干净地销毁(无需担心每个资源的最低费用)。监控警报策略也会解除。
GAIL 涵盖了本实验无法容纳的许多 GCP 上的 GenAI 领域——Gemini 模型选择 (Gemini Pro / Gemini Flash / Gemini Nano)、Vertex AI 模型园地 (Anthropic Claude, Meta Llama, Mistral 等)、Vertex AI Agent Builder(无代码代理预置)、Vertex AI Pipelines (Kubeflow Pipelines + 自定义 MLOps)、Vertex AI Prompt Optimizer、Model Armor / 负责任的 AI 工具、Vertex AI Feature Store、AutoML、自定义训练作业、整个 Generative AI Studio 控制台、BigQuery ML 的 GenAI 界面、Workspace GenAI 功能(“帮我写作”/“帮我整理”)、Gemini for Google Cloud(IDE 助手),以及 Vertex AI Search & Conversation 应用预置(数据存储之上的下一层)。
我们仅限于 Workbench + 数据存储 + 监控这些基本原语,因为它们是最小的可演示形态。Workbench 是您进行原型设计的地方。数据存储是 RAG / Vertex AI Search 读取的地方。监控是您操作任何内容的方式。掌握基础架构;更高级别的构建块(代理、管道、提示)通过 Vertex AI Studio 接入。
有关逐服务概念性覆盖范围,请参阅此认证页面的浏览、手册和Editorial部分。