נבדק לאחרונה: מאי 2026
בנו את שירותי AWS של בחינת GAIL עם Terraform פשוט — בלוק אחד בכל פעם, כאשר כל אחד מהם מקושר בחזרה לתחום במבחן. אותו הקוד עובד גם ב-OpenTofu.
בסוף מעבדה זו תצרו, באמצעות Terraform פשוט, את תשתית ה-GenAI הקטנה והריאלית ביותר של Google — ממשקי API של Vertex AI ו-Discovery Engine מופעלים, מופע Vertex AI Workbench לאב טיפוס, מאגר נתונים (data store) של Discovery Engine המשמש כפרימיטיב מקור הבסיס (grounding-source) עבור RAG ו-Vertex AI Search, והתראת Cloud Monitoring על קצב שגיאות חיזוי של Vertex. ארבעה בלוקים; מפת המושגים של GAIL ממופה לתשתית בפועל.
הדביקו את קטעי הקוד לתוך קובץ main.tf יחיד, הריצו terraform init, ולאחר מכן terraform apply צעד אחר צעד.
>= 1.5 או OpenTofu >= 1.6.your-project-id בבלוק ה-provider.כ-50$/חודש אם ה-Workbench נשאר פועל 24/7. עצרו אותו לאחר כל סשן מעבדה.
אפשרו את ממשקי ה-API של Vertex AI, Discovery Engine (Vertex AI Search), Cloud Notebooks ו-Cloud Monitoring.
terraform {
required_version = ">= 1.5"
required_providers {
google = { source = "hashicorp/google", version = "~> 6.0" }
}
}
provider "google" {
project = "your-project-id" # REPLACE
region = "us-central1"
}
locals {
labels = {
project = "certlabpro-gail"
managed_by = "terraform"
}
}
resource "google_project_service" "aiplatform" {
service = "aiplatform.googleapis.com"
disable_on_destroy = false
}
resource "google_project_service" "notebooks" {
service = "notebooks.googleapis.com"
disable_on_destroy = false
}
resource "google_project_service" "discoveryengine" {
service = "discoveryengine.googleapis.com"
disable_on_destroy = false
}
resource "google_project_service" "monitoring" {
service = "monitoring.googleapis.com"
disable_on_destroy = false
}Vertex AI Workbench הוא משטח ה-Jupyter-בענן שממנו מתחיל כל זרימת אב-טיפוס של GenAI ב-GCP — שווה ערך ל-Amazon SageMaker Studio / Azure ML Workbench. בחינת GAIL בודקת זאת כפרימיטיב ה-מושב המועדף של מדעני הנתונים.
אנו מקצים מופע Workbench קטן מסוג e2-standard-2 שנטען מראש עם ספריות ה-Python של GenAI. ה-Workbench פועל ב-VM מנוהל של Compute Engine מתחת למכסה המנוע — תראו אותו גם במסוף GCE. עצרו את המופע דרך קונסולת Vertex AI Workbench כשאינכם משתמשים בו באופן פעיל כדי למנוע חיוב של כ-50$/חודש בזמן סרק.
resource "google_workbench_instance" "main" {
name = "certlabpro-gail-workbench"
location = "us-central1-a"
gce_setup {
machine_type = "e2-standard-2"
boot_disk {
disk_size_gb = 100
disk_type = "PD_STANDARD"
}
}
labels = local.labels
depends_on = [google_project_service.notebooks]
}Discovery Engine (לשעבר Vertex AI Search) הוא פרימיטיב ה-RAG הדגל של בחינת GAIL — הפנו אותו לקורפוס (דלי GCS, סריקת אתר אינטרנט, מערך נתונים של BigQuery, או JSON מובנה), הוא יאנדקס את התוכן, וקריאות Gemini הבאות יוכלו לבסס את תשובותיהן באותו קורפוס.
אנו יוצרים מאגר נתונים מסוג GENERIC — המיכל הרעיוני לתוכן מאונדקס. פריסות ייצור מאכלסות את המאגר במסמכים דרך ה-Discovery Engine API; עבור המעבדה, המאגר הריק הוא ההדגמה שהמשאב קיים ומחויב בהתאם.
בחינת GAIL בודקת משולש זה של מאגר נתונים ← אפליקציית חיפוש ← תשובות מבוססות כצורת ה-RAG-ארגוני-ב-GCP הסטנדרטית.
resource "google_discovery_engine_data_store" "main" {
data_store_id = "certlabpro-gail-store"
display_name = "GAIL lab data store"
location = "global"
industry_vertical = "GENERIC"
content_config = "CONTENT_REQUIRED"
solution_types = ["SOLUTION_TYPE_SEARCH"]
depends_on = [google_project_service.discoveryengine]
}לעומסי עבודה של GenAI יש ממד תפעולי שבחינת GAIL ממשיכה להעלות: שגיאות חיזוי, חביון, עלות לכל אסימון. אנו מחברים התראת Cloud Monitoring על מדד שגיאות החיזוי של Vertex AI — ההתראה מופעלת כאשר קצב השגיאות עולה על 5% במשך 5 דקות.
עם ארבעה בלוקים במקום (provider+APIs, Workbench לאב טיפוס, מאגר נתונים של Discovery Engine לבסיס (grounding), והתראת Cloud Monitoring לבריאות תפעולית), מפת המושגים של GAIL ממופה לתשתית בפועל שהוקצתה. פריסות GenAI אמיתיות רובדות על גבי בסיס זה בחירות מתוך ספריית המודלים (model garden), אימון מותאם אישית, ניהול פרומפטים, בונה סוכנים (agent builder), ובקרות Model Armor / Responsible AI — אך התשתית שלעיל היא הצורה שתראו בתרחישי בחינת GAIL.
resource "google_monitoring_alert_policy" "vertex_prediction_errors" {
display_name = "GAIL lab — Vertex AI prediction error rate"
combiner = "OR"
conditions {
display_name = "Prediction error rate > 5% over 5 minutes"
condition_threshold {
filter = "metric.type=\"aiplatform.googleapis.com/prediction/online/error_count\" AND resource.type=\"aiplatform.googleapis.com/Endpoint\""
duration = "300s"
comparison = "COMPARISON_GT"
threshold_value = 0.05
aggregations {
alignment_period = "60s"
per_series_aligner = "ALIGN_RATE"
}
}
}
# notification_channels = [] # add channels via console or separate TF resource
depends_on = [google_project_service.monitoring]
}terraform destroy מפרק הכל. מופע ה-Workbench מפסיק לחייב מיד עם ההרס (חיסכון של כ-50$/חודש). מאגר הנתונים של Discovery Engine נהרס באופן נקי (אין חיוב מינימלי לכל משאב לדאוג ממנו). מדיניות התראות הניטור מתנתקת.
GAIL מכסה משטחי GenAI-על-GCP רבים שמעבדה זו אינה יכולה להכיל — בחירות מודל Gemini (Gemini Pro / Gemini Flash / Gemini Nano), Vertex AI Model Garden (Anthropic Claude, Meta Llama, Mistral, וכו'), Vertex AI Agent Builder (הקצאת סוכנים ללא קוד), Vertex AI Pipelines (Kubeflow Pipelines + MLOps מותאם אישית), Vertex AI Prompt Optimizer, כלי Model Armor / Responsible AI, Vertex AI Feature Store, AutoML, עבודות אימון מותאמות אישית, קונסולת Generative AI Studio כולה, משטח ה-GenAI של BigQuery ML, תכונות GenAI של Workspace (עזרו לי לכתוב / עזרו לי לארגן), Gemini עבור Google Cloud (עוזר ה-IDE), והקצאת אפליקציות Vertex AI Search & Conversation (השכבה הבאה מעל מאגרי נתונים).
אנו נצמדים לפרימיטיבים של Workbench + Data Store + Monitoring מכיוון שהם הצורה הקטנה ביותר שניתן להדגים. Workbench הוא המקום שבו אתם בונים אב טיפוס. Data Store הוא מה ש-RAG / Vertex AI Search קורא. Monitoring הוא האופן שבו אתם מפעילים את כל זה. שלטו בתשתית; המבנים ברמה גבוהה יותר (סוכנים, צינורות, פרומפטים) מתחברים דרך Vertex AI Studio.
לכיסוי קונספטואלי של שירות-אחר-שירות, ראו את קטעי עיון, מדריך, ו-Editorial בדף תעודה זה.