Handbuch

Google Cloud Generative AI Leader

Zuletzt überprüft: Mai 2026

Eine übersichtliche Referenz der Architekturmuster, die in der GAIL-Prüfung getestet werden. Von oben nach unten lesen oder zu einem Abschnitt springen.

Domäne 1: Grundlagen der generativen KI

Unterscheidung zwischen KI-Typen für einen geschäftlichen Anwendungsfall.

Verwenden Sie generative KI für die Inhaltserstellung (Text, Bilder, Code). Verwenden Sie traditionelle/diskriminierende KI für Klassifizierung, Vorhersage und Analyse bestehender Daten.

Warum: Generative KI *erstellt* neue, neuartige Inhalte. Traditionelle KI *analysiert* oder *kategorisiert* bestehende Daten. Dies ist ein grundlegendes Konzept.

Entscheidung, ob ein Modell von Grund auf neu erstellt oder ein vortrainiertes Modell verwendet werden soll.

Nutzen Sie Foundation Models (z.B. Gemini), die auf massiven, vielfältigen Datensätzen vortrainiert sind, und passen Sie diese an spezifische Aufgaben an.

Warum: Foundation Models reduzieren die Entwicklungszeit und Ressourcenkosten drastisch, indem sie eine leistungsstarke, universelle Basis bieten, die durch Prompting oder Fine-Tuning spezialisiert werden kann.

Eine Lösung muss Kombinationen aus Text, Bildern, Audio oder Video verstehen und verarbeiten.

Verwenden Sie ein multimodales Foundation Model wie Gemini, das nativ über verschiedene Datentypen hinweg in einem einzigen Prompt argumentieren kann.

Warum: Multimodale Modelle vermeiden die Komplexität, separate Modelle für jeden Datentyp zusammenzufügen, und ermöglichen so ein ausgefeilteres, domänenübergreifendes Verständnis.

Ein LLM generiert selbstbewusst plausible, aber sachlich falsche Informationen.

Implementieren Sie Grounding-Techniken, hauptsächlich Retrieval-Augmented Generation (RAG), um das Modell mit überprüfbaren Datenquellen zu verbinden.

Warum: Halluzinationen sind ein inhärentes Risiko. Grounding verankert die Antworten des Modells in einer Wahrheitsquelle und ist damit die primäre Strategie zur Verbesserung der faktischen Genauigkeit.

Verständnis der Kerntechnologie, die es modernen LLMs ermöglicht, Kontext zu verstehen.

Die Transformer-Architektur mit ihrem Self-Attention-Mechanismus ermöglicht es dem Modell, die Bedeutung aller Wörter im Input relativ zueinander zu gewichten.

Warum: Self-Attention ist die Schlüsselinnovation, die es LLMs ermöglicht, langfristige Abhängigkeiten und Kontext zu erfassen, im Gegensatz zu älteren sequentiellen Modellen (RNNs).

Aufbau eines Suchsystems, das die Bedeutung hinter Abfragen versteht, nicht nur Schlüsselwörter.

Verwenden Sie ein Embedding-Modell (z.B. von Vertex AI), um Text in numerische Vektoren umzuwandeln. Speichern Sie diese Vektoren und verwenden Sie die Vektorähnlichkeitssuche, um semantisch verwandte Inhalte zu finden.

Warum: Embeddings erfassen die semantische Bedeutung. Abfragen können konzeptionell ähnliche Ergebnisse finden, auch wenn sie keine Schlüsselwörter teilen.

Eine kreative Anwendung benötigt vielfältige Ausgaben, während ein faktenbasierter Chatbot deterministische Antworten benötigt.

Erhöhen Sie den `temperature`-Parameter (z.B. >0.7) für kreative Aufgaben. Verringern Sie `temperature` (z.B. <0.3) für faktenbasierte, konsistente Antworten.

Warum: Temperature steuert die Zufälligkeit der Ausgabe. Eine niedrige Temperature wählt die wahrscheinlichsten Wörter; eine hohe Temperature erhöht die Vielfalt.

Verarbeitung eines großen Dokuments, das die Token-Grenze des Modells überschreitet.

Entwerfen Sie eine Lösung mithilfe von Chunking, Zusammenfassungen oder einem RAG-Ansatz, um das Dokument in überschaubaren Teilen zu verarbeiten, die in das Kontextfenster passen.

Warum: Modelle haben ein endliches Kontextfenster. Jeder Input, der diese Grenze überschreitet, wird ignoriert, was zu Informationsverlust führt. Die Architektur muss dies berücksichtigen.

Domäne 2: Entwicklung generativer KI-Lösungen

Entdecken, Testen und Bereitstellen einer Vielzahl von Foundation Models auf Google Cloud.

Verwenden Sie Vertex AI Model Garden als zentralen Katalog für Googles proprietäre Modelle (Gemini), Open-Source-Modelle (Llama, Mistral) und Partnermodelle.

Warum: Model Garden ist der einheitliche Zugangspunkt für den Zugriff auf eine kuratierte Sammlung von Foundation Models, was die Entdeckung und Bereitstellung in einer Enterprise-Umgebung vereinfacht.

Referenz

Ein KI-Assistent muss Fragen zu häufig wechselnden Informationen beantworten, wie z.B. Produktbestand oder aktuelle Nachrichten.

Implementieren Sie ein Retrieval-Augmented Generation (RAG)-Muster. Verbinden Sie das LLM mit einer externen, aktuellen Wissensdatenbank (z.B. einer Datenbank, einem Dokumentenspeicher).

Warum: RAG ermöglicht dem Modell den Zugriff auf Echtzeitinformationen zur Inferenzzeit, wodurch dessen Wissensstand-Grenze überwunden und genaue, aktuelle Antworten geliefert werden.

Aufbau einer Unternehmenssuchmaschine oder eines konversationellen KI-Agenten, der auf Unternehmensdaten basiert.

Verwenden Sie Vertex AI Search and Conversation (Teil von Agent Builder). Verweisen Sie es auf Ihre Datenquellen (Websites, Dokumente), um eine Such-App oder einen Chatbot zu erstellen.

Warum: Dies ist eine verwaltete Low-Code-Lösung zum Erstellen von fundierten, unternehmenstauglichen Such- und Chat-Anwendungen, die die Entwicklungskomplexität erheblich reduziert.

Ein Modell muss eine hochspezialisierte Fähigkeit, Terminologie oder ein konsistentes Verhalten erlernen, das durch reines Prompting nicht erreicht werden kann.

Führen Sie ein überwachtes Fine-Tuning an einem Foundation Model unter Verwendung eines kuratierten Datensatzes hochwertiger Beispiele durch.

Warum: Fine-Tuning passt die internen Gewichte des Modells an und macht es zu einem Experten in einem spezifischen Bereich. Es ist leistungsfähiger als Prompting für tiefe Spezialisierung.

Ein Foundation Model muss für eine bestimmte Domäne angepasst werden, es fehlen jedoch die Ressourcen für ein vollständiges Fine-Tuning.

Verwenden Sie eine Parameter-Efficient Fine-Tuning (PEFT)-Methode wie LoRA oder Adapter-Tuning, die in Vertex AI verfügbar ist.

Warum: PEFT stimmt nur einen kleinen Bruchteil der Modellparameter ab und erreicht eine signifikante Anpassung mit drastisch geringeren Rechenkosten und Zeitaufwand.

Ein Modell versagt bei Aufgaben, die komplexes, mehrstufiges Denken erfordern (z.B. mathematische Probleme, Logikrätsel).

Verwenden Sie Chain-of-Thought (CoT) Prompting. Weisen Sie das Modell an, "Schritt für Schritt zu denken", bevor es die endgültige Antwort gibt.

Warum: CoT ermutigt das Modell, ein Problem aufzuschlüsseln, was sich als signifikante Verbesserung der Denkfähigkeit und der Genauigkeit der endgültigen Antwort bei komplexen Aufgaben erwiesen hat.

Das Modell muss konsistent Ausgaben in einem spezifischen Format generieren (z.B. JSON, ein bestimmter Schreibstil).

Verwenden Sie Few-Shot Prompting. Geben Sie 2-5 Beispiele des gewünschten Input-Output-Musters direkt im Prompt an.

Warum: Beispiele zu liefern ist effektiver als nur das Format zu beschreiben. Das Modell lernt das Muster und wendet es auf die neue Anfrage an.

Auswahl der richtigen Gemini-Modellvariante für einen spezifischen Anwendungsfall.

Verwenden Sie Gemini Pro für komplexes, hochwertiges Reasoning. Verwenden Sie Gemini Flash für Aufgaben mit hohem Volumen, geringer Latenz und Kostensensibilität. Verwenden Sie Gemini Nano für On-Device-Anwendungen.

Warum: Die Auswahl der richtigen Modellgröße ist ein kritischer Kompromiss zwischen Fähigkeit, Geschwindigkeit und Kosten. Die Verwendung des kleinsten Modells, das die Anforderungen erfüllt, ist eine Best Practice.

Automatisierung der Extraktion strukturierter Daten (z.B. Posten, Daten, Summen) aus unstrukturierten Dokumenten wie Rechnungen oder Belegen.

Verwenden Sie Google Cloud Document AI. Nutzen Sie dessen vortrainierte Prozessoren für gängige Dokumententypen oder erstellen Sie einen benutzerdefinierten Prozessor für einzigartige Formate.

Warum: Document AI ist ein speziell entwickelter Dienst, der über einfaches OCR hinausgeht, um Dokumentenstruktur und Semantik zu verstehen, und somit eine viel höhere Genauigkeit für Datenextraktionsaufgaben bietet.

Referenz

Anwendung generativer KI-Fähigkeiten (z.B. Zusammenfassung, Sentiment-Analyse) auf Daten, die in einem BigQuery Data Warehouse gespeichert sind.

Verwenden Sie BigQuery ML, um Vertex AI Foundation Models direkt mit SQL-Befehlen aufzurufen. Verarbeiten Sie die Daten an Ort und Stelle, ohne sie zu verschieben.

Warum: Dies vereinfacht die Architektur, verbessert die Sicherheit, indem Daten in BigQuery verbleiben, und ermöglicht Datenanalysten, KI mithilfe vertrauter SQL-Syntax zu nutzen.

Steigerung der Produktivität für Geschäftsbenutzer innerhalb ihrer bestehenden Tools wie Gmail, Docs und Sheets.

Integrieren Sie Gemini für Google Workspace. Dies bietet KI-Unterstützung direkt in den Workspace-Anwendungen für Aufgaben wie das Entwerfen von E-Mails, das Zusammenfassen von Dokumenten und das Analysieren von Daten.

Warum: Dies bringt KI-Funktionen zu den Benutzern in ihren vertrauten Arbeitsablauf, beschleunigt die Akzeptanz und bietet sofortige Produktivitätsvorteile ohne Kontextwechsel.

Verbesserung der Entwicklergeschwindigkeit und Codequalität.

Stellen Sie Entwicklern Gemini Code Assist zur Verfügung, das sich in IDEs integriert, um Code-Vervollständigung, -Generierung, -Erklärung und Testerstellung anzubieten.

Warum: KI-Code-Assistenten reduzieren den Zeitaufwand für Boilerplate-Code, helfen beim Verständnis komplexer Codebasen und verbessern die allgemeine Entwicklerproduktivität.

Auswahl des richtigen Tools für generative KI-Experimente und -Entwicklung.

Verwenden Sie Google AI Studio für schnelles, kostenloses webbasiertes Prototyping mit Gemini-Modellen über einen API-Schlüssel. Verwenden Sie Vertex AI Studio für die Entwicklung auf Unternehmensebene mit GCP-Integration, Sicherheitskontrollen und MLOps-Funktionen.

Warum: Google AI Studio ist für schnelles Prototyping; Vertex AI Studio ist der Weg zur Produktion und bietet Unternehmenssicherheit, Daten-Governance und Skalierbarkeit.

Ein KI-Agent muss eine spezifische Persona annehmen, Regeln befolgen und einen konsistenten Ton über Gespräche hinweg beibehalten.

Definieren Sie das Verhalten des Agenten mithilfe eines Systemprompts. Diese Anweisung wird dem Modell separat von der Benutzeranfrage zur Verfügung gestellt, um sein Gesamtverhalten zu steuern.

Warum: Ein Systemprompt ist die effektivste Methode, um dauerhafte, konsistente Verhaltensrichtlinien festzulegen, ohne sie in jedem benutzerseitigen Prompt wiederholen zu müssen.

Eine Lösung erfordert eine gängige, spezifische KI-Funktionalität wie Übersetzung, Speech-to-Text oder Text-to-Speech.

Verwenden Sie die vortrainierten, speziell entwickelten APIs: Cloud Translation API, Speech-to-Text API oder Text-to-Speech API.

Warum: Diese verwalteten APIs sind hochoptimiert für ihre spezifische Aufgabe und sind kostengünstiger und einfacher zu implementieren als die Verwendung eines generischen LLM für dieselbe Funktion.

Domäne 3: Betrieb generativer KI-Lösungen

Ein KI-System wird für einen kritischen Prozess eingesetzt, bei dem Fehler kostspielig oder gefährlich sind (z.B. medizinische Zusammenfassungen, Finanzberichte).

Implementieren Sie einen Human-in-the-Loop (HITL)-Workflow. KI erstellt einen Entwurf, der dann von einem menschlichen Experten überprüft, bearbeitet und genehmigt wird.

Warum: HITL kombiniert die Geschwindigkeit der KI mit menschlichem Urteilsvermögen und Verantwortung, was für die Risikominderung in kritischen Anwendungen unerlässlich ist.

Die Leistung eines KI-Modells verschlechtert sich im Laufe der Zeit nach der Bereitstellung in der Produktion.

Implementieren Sie kontinuierliches Monitoring, um die Modellleistung zu verfolgen und Data Drift oder Concept Drift zu erkennen.

Warum: Die reale Welt ändert sich. Data Drift tritt auf, wenn Produktionsdaten nicht mehr den Trainingsdaten ähneln. Monitoring ist entscheidend, um zu wissen, wann ein erneutes Training oder eine Aktualisierung notwendig ist.

Prognose und Management der Betriebskosten eines generativen KI-Dienstes.

Verstehen Sie, dass Vertex AI GenAI-Dienste auf einer Pay-per-Use-Basis abgerechnet werden, typischerweise pro 1.000 Eingabe- und Ausgabecharaktere oder Token.

Warum: Die Kosten sind direkt an die Nutzung gebunden. Architekten müssen Systeme entwerfen, die Prompt- und Antwortlängen verwalten, um die Betriebskosten zu kontrollieren.

Eine KI-Anwendung weist bei Spitzenverkehr hohe Latenz oder Fehler auf.

Skalieren Sie die Modellbereitstellung. Für Vertex AI Prediction Endpoints erhöhen Sie die Anzahl der Maschinenreplikate oder verwenden Sie leistungsstärkere Maschinentypen.

Warum: Die Inferenzleistung ist nicht unendlich skalierbar. Die zugrunde liegende Infrastruktur muss so dimensioniert sein, dass sie das erwartete Anfragevolumen bewältigen kann.

Eine generative KI-Lösung muss sensible Daten verarbeiten, die regionalen Datensouveränitätsvorschriften (z.B. DSGVO) unterliegen.

Konfigurieren Sie Vertex AI zur Verwendung regionaler Endpunkte. Integrieren Sie VPC Service Controls, um einen Service Perimeter zu erstellen, der Datenexfiltration verhindert.

Warum: Google Cloud bietet explizite Kontrollen, um sicherzustellen, dass Daten innerhalb einer bestimmten geografischen Region verarbeitet und von öffentlichen Netzwerken isoliert werden, was für viele Compliance-Regime obligatorisch ist.

Eine Anwendung verarbeitet eine Mischung aus einfachen und komplexen Abfragen, und die Verwendung eines einzigen großen Modells ist kostenintensiv.

Implementieren Sie einen Modell-Router. Klassifizieren Sie eingehende Prompts vor und leiten Sie einfache Anfragen an ein kleines, schnelles und kostengünstiges Modell (z.B. Gemini Flash) und komplexe Anfragen an ein leistungsstarkes Modell (z.B. Gemini Pro).

Warum: Dieses Muster optimiert das Kosten-Leistungs-Verhältnis, indem es die am besten geeignete Ressource für jede Aufgabe verwendet, was die Gesamtbetriebskosten erheblich senkt.

Domäne 4: Verantwortungsbewusstes Design und Governance generativer KI

Start einer neuen generativen KI-Initiative innerhalb der Organisation.

Beginnen Sie mit der Identifizierung eines hochrelevanten Geschäftsproblems oder Anwendungsfalls. Beginnen Sie nicht mit der Technologie und suchen Sie dann nach einem Problem.

Warum: Erfolgreiche KI-Projekte sind solche, die einen messbaren Geschäftswert liefern. Eine klare Problemstellung gewährleistet Fokus und Ausrichtung des Projekts an strategischen Zielen.

Ein KI-Modell zeigt voreingenommenes Verhalten gegenüber bestimmten demografischen Gruppen.

Gehen Sie mit Voreingenommenheit während des gesamten ML-Lebenszyklus um: Prüfen und kuratieren Sie Trainingsdaten auf Fairness, testen Sie das Modell auf unterschiedliche Auswirkungen und implementieren Sie ein Post-Deployment-Monitoring für voreingenommene Ergebnisse.

Warum: Voreingenommenheit entsteht hauptsächlich aus den Daten. Sie kann nicht mit einer einzigen technischen Lösung behoben werden; sie erfordert einen umfassenden, fortlaufenden Prozess des Testens und der Minderung.

Ein Unternehmen muss seine KI-Nutzung verantwortungsbewusst über mehrere Abteilungen hinweg skalieren.

Einrichtung eines funktionsübergreifenden KI-Governance-Ausschusses. Erstellen Sie klare Richtlinien für KI-Entwicklung, Risikobewertung, ethische Überprüfung, Bereitstellung und Überwachung.

Warum: Zentralisierte Governance gewährleistet Konsistenz, managt Risiken und fördert den verantwortungsvollen Einsatz von KI, wodurch ein chaotisches "Wilder Westen" unkontrollierter KI-Projekte verhindert wird.

Verhindern, dass ein öffentlich zugänglicher Chatbot schädliche, hasserfüllte oder unangemessene Inhalte generiert.

Aktivieren Sie die integrierten Sicherheitsfilter in Vertex AI. Konfigurieren Sie Schwellenwerte für Kategorien wie Hassrede, Belästigung und gefährliche Inhalte.

Warum: Diese vortrainierten Klassifizierungsmodelle bieten eine entscheidende erste Verteidigungslinie gegen die Generierung unsicherer Inhalte und bilden einen Kernbestandteil der verantwortungsvollen KI-Bereitstellung.

Rechtfertigung einer KI-Investition gegenüber der Geschäftsleitung.

Messen Sie den ROI ganzheitlich. Verfolgen Sie Effizienzmetriken (z.B. Zeitersparnis, Kostenreduzierung) und Effektivitätsmetriken (z.B. Umsatzsteigerung, Qualitätsverbesserung, Kundenzufriedenheit).

Warum: Eine umfassende ROI-Analyse geht über reine Kosteneinsparungen hinaus, um den vollen Geschäftswert zu erfassen, einschließlich Qualitätsverbesserungen und neuen Umsatzmöglichkeiten.

Bereitstellung eines KI-Systems in einer regulierten Branche (z.B. Finanzen, Gesundheitswesen), die Entscheidungstransparenz erfordert.

Für traditionelles ML verwenden Sie Vertex AI Explainability. Für GenAI verwenden Sie RAG mit Quellenzuordnung, um Zitate und Begründungen für generierte Antworten zu liefern.

Warum: Transparenz schafft Vertrauen und ist in vielen Bereichen eine gesetzliche Anforderung. Das Bereitstellen von Zitaten für GenAI-Antworten ist die primäre Methode zur Erklärbarkeit.

Entwicklung einer Unternehmensstrategie zur Sicherung von KI-Systemen vor neuen Bedrohungsarten.

Übernehmen Sie die Prinzipien von Googles Secure AI Framework (SAIF), das Empfehlungen zur Sicherung der KI-Lieferkette, des Modells und der Bereitstellung bietet.

Warum: SAIF bietet einen strukturierten, konzeptionellen Leitfaden zur Erweiterung traditioneller Cybersicherheitsverfahren auf die einzigartigen Herausforderungen der KI, wie Prompt Injection und Data Poisoning.

Referenz

Einführung eines neuen KI-Tools für die Belegschaft, um eine erfolgreiche Akzeptanz zu gewährleisten.

Implementieren Sie ein strukturiertes Change Management Programm. Sichern Sie die Unterstützung der Geschäftsleitung, kommunizieren Sie klar über die Rolle der KI, bieten Sie umfassende Schulungen an und integrieren Sie KI schrittweise in bestehende Workflows.

Warum: Technologie ist nur ein Teil der Lösung. Eine erfolgreiche KI-Akzeptanz hängt von Menschen und Prozessen ab und erfordert bewusste Anstrengungen, um Fähigkeiten, Vertrauen und neue Arbeitsweisen aufzubauen.

Verwendung von Kundendaten zum Trainieren oder Ausführen eines generativen KI-Modells.

Stellen Sie die strikte Einhaltung der Datenschutzbestimmungen (z.B. DSGVO) sicher. Verwenden Sie die Prinzipien der Datenminimierung, anonymisieren Sie PII wo möglich und überprüfen Sie sorgfältig die Datenverwendungsrichtlinien des KI-Anbieters.

Warum: Die Verwendung von Kundendaten mit KI birgt erhebliche Datenschutz- und Compliance-Risiken. Data Governance und Datenschutz müssen von Anfang an zentrale Designüberlegungen sein.