🏠Startseite 📚Zertifizierungen 📱Mobile Apps

🎓Prüfungsinfo

✍️Blog 📊Fortschritt 📅Kalender 💬Support

Datenschutzrichtlinie Nutzungsbedingungen Kontakt Cookie-Richtlinie Haftungsausschluss Barrierefreiheit DMCA / Urheberrecht

Zum Inhalt springen

AIF-C01Handbuch

Handbuch

AWS Certified AI Practitioner

Zuletzt überprüft: April 2026

Eine übersichtliche Referenz der Architekturmuster, die in der AIF-C01-Prüfung getestet werden. Von oben nach unten lesen oder zu einem Abschnitt springen.

Abschnitte

Grundlagen von KI und ML11 Einträge
Grundlagen der Generativen KI14 Einträge
Anwendungen von Foundation Models14 Einträge
Richtlinien für verantwortungsvolle KI7 Einträge
Sicherheit, Compliance und Governance für KI-Lösungen9 Einträge

Grundlagen von KI und ML

Wählen Sie ein Lernparadigma: gelabelte Daten, ungelabelte Daten oder interaktives Trial-and-Error.

Gelabelt → überwacht (supervised). Ungelabelte Clustering/Segmentierung → unüberwacht (unsupervised). Agent lernt durch Belohnung → Reinforcement.

Warum: Die Wahl wird durch die vorhandenen Daten bestimmt. RLHF ist Reinforcement Learning, das durch menschliche Bewertungen gesteuert wird und zur Ausrichtung von LLMs verwendet wird.

Passen Sie ein vorab trainiertes Modell an eine neue, verwandte Aufgabe an, anstatt es von Grund auf neu zu trainieren.

Nutzen Sie Transfer Learning. Fine-tuning des bestehenden Modells auf dem neuen Domänen-Datensatz.

Warum: Wiederverwendet gelernte Repräsentationen, reduziert Trainingszeit und Datenbedarf im Vergleich zum Aufbau eines Modells von Grund auf.

Wählen Sie einen SageMaker Inferenzmodus für die Workload-Form.

Stabile geringe Latenz → Echtzeit. Spitz/inaktiver Traffic → serverless. Große Payload (≤1 GB) oder langer Job (≤1 Std.) mit nahezu Echtzeit → asynchron. Offline-Massenverarbeitung → Batch Transform.

Warum: Echtzeit hat Payload-/Timeout-Limits; asynchrone Warteschlangen für große Jobs; Batch ist für periodisches Offline-Scoring.

Mehrere ML-Teams müssen entwickelte Features teilen und wiederverwenden.

Amazon SageMaker Feature Store als zentrales Repository für Online- + Offline-Features.

Warum: Vermeidet redundantes Feature Engineering und gewährleistet die Konsistenz von Training/Serving über Teams hinweg.

Erstellen Sie ML-Modelle ohne Code oder ML-Expertise (z.B. Nachfrageprognose für Analysten).

Amazon SageMaker Canvas — visuelle No-Code-Oberfläche für Training und Inferenz.

Stellen Sie ein Foundation Model schnell innerhalb einer VPC bereit.

Amazon SageMaker JumpStart — vorab trainierte Modelle werden als SageMaker Endpoints in Ihrer VPC bereitgestellt.

Warum: JumpStart bündelt Modellartefakte und Notebooks für die One-Click-Bereitstellung in einer VPC.

Automatisieren Sie die Hyperparameter-Abstimmung und Modellauswahl.

Amazon SageMaker Autopilot — erkundet Algorithmen und stimmt Hyperparameter automatisch ab.

Wählen Sie die richtige Evaluierungsmetrik für ein Klassifikationsmodell.

Korrektheit der Bild-/Binärklassifikation → Genauigkeit (accuracy). Klassenaufschlüsselung → Konfusionsmatrix (confusion matrix). Ungleichgewichtige Klassen → F1, Präzision, Recall. Schwellenwert-unabhängig → AUC.

Warum: Genauigkeit täuscht bei ungleichgewichtigen Daten; die Konfusionsmatrix zeigt TP/FP/TN/FN-Zählungen; F1 gleicht Präzision und Recall aus.

Die Kosten, einen positiven Fall zu übersehen (False Negative), sind viel höher als die eines False Positives – z.B. Betrugserkennung, Krankheits-Screening.

Optimieren Sie für Recall (Sensitivität). Akzeptieren Sie eine geringere Präzision.

Warum: Recall = TP / (TP + FN). Seine Maximierung minimiert übersehene Positive auf Kosten von mehr Fehlalarmen.

Das Modell erzielt hohe Werte auf Trainingsdaten, aber schlechte auf Test-/Produktionsdaten; oder die Genauigkeit verbessert sich zuerst, verschlechtert sich dann mit zunehmenden Epochen.

Overfitting. Mildern Sie mit mehr Daten, Regularisierung, Early Stopping, Dropout oder einem einfacheren Modell.

Warum: Ein großer Unterschied zwischen Train- und Testdaten bedeutet, dass das Modell Rauschen auswendig gelernt hat, anstatt Muster zu lernen.

Wählen Sie den verwalteten KI-Dienst für eine spezifische Aufgabe.

NLP/Sentiment/Entitäten → Comprehend. Sprache zu Text → Transcribe. Text zu Sprache → Polly. Übersetzung → Translate. Chatbot/Sprach-UI → Lex. Bild/Video → Rekognition. Dokument-/PDF-Textextraktion → Textract. Empfehlungen → Personalize. Prognose → Forecast.

Warum: Verwaltete KI-Dienste sind benutzerdefinierten Modellen überlegen, wenn die Aufgabe klar definiert und im Katalog verfügbar ist.

Grundlagen der Generativen KI

Erstellen Sie eine generative KI-Anwendung auf AWS, ohne die Modellinfrastruktur zu verwalten.

Amazon Bedrock — vollständig verwalteter Zugriff auf Foundation Models (Anthropic Claude, Meta Llama, Amazon Titan, Stability, AI21, Mistral, Cohere) über eine einzige API.

Warum: Keine GPU-Bereitstellung, kein Modell-Hosting; Zahlung pro Token. SageMaker JumpStart ist die Alternative, wenn Sie einen selbst gehosteten Endpunkt in Ihrer VPC benötigen.

Definieren Sie, was ein Modell zu einem "Foundation Model" macht.

Großes Modell, vorab auf diversen, meist ungelabelten Daten trainiert; an viele nachgelagerte Aufgaben anpassbar durch Prompting, Fine-tuning oder RAG.

Schätzen Sie ab, wie viel Input in einen Prompt passt und was die Inferenzkosten antreibt.

Tokens sind Subwort-Einheiten. Kontextfenster = maximale Tokens pro Anfrage (Input + Output). Inferenzkosten sind ungefähr proportional zu den verarbeiteten Tokens.

Warum: Die Tokenanzahl, nicht die Anzahl der Anfragen, bestimmt die Bedrock-Preise. Wenn ein langes Dokument das Kontextfenster überschreitet, teilen Sie es in Chunks auf oder wählen Sie ein Modell mit größerem Fenster.

Wählen Sie den Ausgabestil: deterministisch vs. kreativ.

Niedrige Temperatur (~0.0–0.3) → deterministisch, wiederholbar. Hohe Temperatur (~0.7–1.0) → kreativ, vielfältig. Verwenden Sie 0 für Klassifikation oder Sentiment, um konsistente Labels zu erhalten.

Beschränken Sie den Kandidaten-Token-Pool über die Temperatur hinaus.

Top-K = nur die K wahrscheinlichsten Tokens berücksichtigen. Top-P (Nucleus) = Tokens berücksichtigen, bis die kumulative Wahrscheinlichkeit P erreicht.

Warum: Top-P passt die Größe des Kandidatensatzes an die Verteilungsform an; Top-K ist fest begrenzt.

Erhalten Sie LLM-Ausgabe in einem bestimmten Stil, einer bestimmten Länge oder Sprache.

Prompt Engineering. Fügen Sie explizite Anweisungen hinzu ("Antworten Sie auf Französisch, unter 50 Wörtern, formeller Ton").

Warum: Günstiger und schneller als Fine-tuning, Retraining oder Änderung der Modellgröße für stilistische Kontrolle.

Verbessern Sie die LLM-Genauigkeit bei einer bestimmten Aufgabe ohne Retraining.

Few-shot Prompting — betten Sie 2–5 gelabelte Input-/Output-Beispiele in den Prompt vor dem neuen Input ein.

Warum: In-context Learning ermöglicht dem Modell, Muster mit Beispielen abzugleichen, ohne Gewichte zu aktualisieren.

LLM gibt falsche Antworten bei mehrstufigen Denkaufgaben.

Chain-of-Thought Prompting — weisen Sie das Modell an, die Denkphasen vor der endgültigen Antwort durchzugehen ("Lassen Sie uns Schritt für Schritt nachdenken").

LLM generiert Text, der plausibel klingt, aber faktisch falsch oder erfunden ist.

Halluzination. Mildern Sie mit RAG (Basierend auf abgerufenen Fakten), Bedrock Guardrails, niedrigerer Temperatur und menschlicher Überprüfung von kritischen Ausgaben.

Unterstützen Sie semantische Suche, Clustering oder RAG-Abruf über Text- oder multimodale Daten.

Verwenden Sie ein Embedding-Modell (z.B. Titan Embeddings, Cohere Embed), um Inhalte in dichte Vektoren umzuwandeln. Speichern und abfragen in einer Vector DB.

Warum: Embeddings erfassen semantische Bedeutung, sodass ähnliche Elemente im Vektorraum nahe beieinander liegen (Kosinus- / Skalarprodukt-Ähnlichkeit).

Suchanwendung akzeptiert sowohl Text als auch Bilder als Input.

Multimodales Embedding-Modell (z.B. Titan Multimodal Embeddings) — projiziert Text und Bilder in denselben Vektorraum.

Prototypisieren Sie eine generative KI-Anwendung schnell ohne Code oder AWS-Konto-Setup.

PartyRock (Amazon Bedrock Playground) — browserbasierter No-Code-App-Builder.

Wählen Sie ein Bedrock-Preismodell.

Variable / unvorhersehbare Last → On-Demand (pro Token). Konstantes hohes Volumen oder garantierter Durchsatz → Provisioned Throughput. Benutzerdefinierte Fine-tuned Modelle → müssen Provisioned Throughput verwenden.

Warum: On-Demand hat keine Verpflichtung; Provisioned Throughput kauft dedizierte Kapazität in Modelleinheiten.

Wählen Sie die günstigste Anpassung, die die gewünschte Qualität liefert.

Versuchen Sie es in dieser Reihenfolge: (1) Prompt Engineering, (2) RAG mit einer Wissensdatenbank, (3) Fine-tuning, (4) fortgesetztes Pre-training.

Warum: Aufwand und Kosten steigen mit jedem Schritt. Hören Sie bei dem ersten auf, das die Anforderungen erfüllt.

Anwendungen von Foundation Models

Erweitern Sie ein Foundation Model mit privaten Unternehmensdaten (PDFs, Dokumente, S3-Inhalte) ohne Fine-tuning.

Erstellen Sie eine Amazon Bedrock Knowledge Base. Bedrock übernimmt die Aufnahme, Chunking, Embedding und den Abruf (RAG) zur Inferenzzeit.

Warum: Günstiger und schneller zu aktualisieren als Fine-tuning. Änderungen der Quelldaten → KB neu synchronisieren; kein Retraining.

Daten ändern sich häufig (Inventar, Preise, Nachrichten) und das Modell muss den aktuellen Zustand widerspiegeln.

RAG mit einer Wissensdatenbank. Vermeiden Sie Fine-tuning — Retraining-Zyklen können nicht mithalten.

Warum: RAG trennt das Modell von den Daten; die KB wird unabhängig vom Modell aktualisiert.

Fine-tuning eines Foundation Models mit gelabelten Beispielen für eine spezifische Aufgabe.

Stellen Sie Prompt-Completion-Paare (Anweisung-Antwort) bereit. Das JSONL-Format ist Standard.

Warum: Instruction Fine-tuning lehrt das Modell, Benutzereingaben den gewünschten Ausgaben in der Zielaufgabe zuzuordnen.

Lehren Sie ein Foundation Model spezialisiertes Vokabular (medizinisch, juristisch, wissenschaftlich) mit vielen ungelabelten Domänen-Texten.

Fortgesetztes Pre-training auf dem ungelabelten Domänenkorpus.

Warum: Fortgesetztes Pre-training aktualisiert das Verständnis des Modells für Vokabular und Konzepte; Instruction Fine-tuning lehrt Aufgabenverhalten. Unterschiedliches Ziel, unterschiedliche Datenform.

Mehrstufiger Workflow, der LLM-Reasoning mit Aufrufen externer APIs, Datenbanken oder AWS-Diensten kombiniert.

Amazon Bedrock Agents — orchestriert LLM-Reasoning, Tool-/API-Aufrufe und Ergebnissynthese in einer einzigen verwalteten Laufzeitumgebung.

Warum: Agents planen Schritte, rufen Tools auf und fügen Ergebnisse zu einer endgültigen Antwort zusammen, ohne dass Sie die Orchestrierungs-Schleife schreiben müssen.

Wählen Sie eine Vektordatenbank für Embeddings.

Managed RAG → Bedrock Knowledge Bases (verwaltet den Vektorspeicher automatisch). Benutzerdefinierte Vektor-DB → OpenSearch Service (k-NN), Aurora PostgreSQL mit pgvector, Neptune Analytics oder RDS for PostgreSQL mit pgvector.

Warum: OpenSearch ist der Standard für hochskalierendes k-NN; pgvector nutzt eine bestehende relationale DB wieder.

Stellen Sie ein Fine-tuned Modell von Bedrock für das Produktions-Serving bereit.

Kaufen Sie Provisioned Throughput für das benutzerdefinierte Bedrock-Modell. Benutzerdefinierte Modelle können nicht über On-Demand-Preise aufgerufen werden.

Warum: Die Kapazität benutzerdefinierter Modelle ist dediziert, wird in Modelleinheiten abgerechnet und ist für den Aufruf erforderlich.

Schätzen oder reduzieren Sie die Bedrock-Inferenzkosten.

Kosten ≈ verarbeitete Tokens × Rate pro Token. Reduzieren Sie durch Kürzung von Prompts, Kürzung von Few-shot-Beispielen, Auswahl kleinerer Modelle oder Verwendung von Prompt-Caching, wo unterstützt.

Generieren Sie hochpräzise gelabelte Daten mit Human-in-the-Loop-Überprüfung (z.B. spezialisierte Bilder, medizinische Aufzeichnungen).

Amazon SageMaker Ground Truth Plus — verwaltete HITL-Labeling-Arbeitskraft.

Warum: Für die periodische Überprüfung von Modellvorhersagen mit geringer Konfidenz, kombinieren Sie es mit Amazon A2I (Augmented AI).

Spracherkennung hört domänenspezifische Begriffe (medizinisch, juristisch, Markennamen) falsch.

Amazon Transcribe mit einem benutzerdefinierten Sprachmodell oder benutzerdefiniertem Vokabular, das auf Domänen-Text trainiert wurde.

Das Modell funktioniert gut im Training, aber schlecht in der Produktion (Overfit) — erhöhen Sie die Generalisierung ohne die Architektur zu ändern.

Erhöhen Sie Volumen und Diversität der Trainingsdaten. Kürzen Sie keine Daten und fügen Sie nicht nur Hyperparameter hinzu.

Warum: Repräsentativere Daten sind die effektivste Lösung; Regularisierung und Early Stopping helfen, aber Daten sind entscheidend.

Bewerten Sie die Qualität generativer Ausgaben.

Übersetzungsqualität → BLEU. Zusammenfassungsqualität → ROUGE. Semantische Ähnlichkeit zur Referenz → BERTScore. Stilistische Präferenz → menschliche Bewertung mit benutzerdefinierten Prompt-Sets.

Wählen Sie ein Bedrock Foundation Model für einen Anwendungsfall, bei dem der Ausgabestil wichtig ist.

Führen Sie eine menschliche Bewertung auf einem benutzerdefinierten Prompt-Datensatz über alle Kandidatenmodelle durch. Verlassen Sie sich nicht allein auf öffentliche Leaderboards oder Latenzmetriken.

Warum: Stil-/Ton-Passung ist subjektiv; Benchmarks erfassen dies nicht.

Generieren Sie Diagramme und Dashboards aus natürlichsprachlichen Fragen über Geschäftsdaten.

Amazon Q in QuickSight — natürlichsprachliche BI über QuickSight-Datensätze.

Richtlinien für verantwortungsvolle KI

Erkennen Sie Bias in Trainingsdaten oder Modellvorhersagen; erstellen Sie Erklärbarkeitsberichte.

Amazon SageMaker Clarify. Führt Bias-Metriken über geschützte Attribute vor und nach dem Training aus, plus SHAP-basierte Feature-Attribution.

Warum: Erforderlich für regulierte Bereiche (Kreditvergabe, Personalwesen, Gesundheitswesen), in denen Sie Fairness und Erklärbarkeit nachweisen müssen.

Modell schneidet für eine Demografie, ethnische Gruppe oder Geografie schlechter ab (z.B. markiert bestimmte Gruppen überproportional).

Sampling Bias. Ausgleich des Datensatzes: Datenaugmentation für unterrepräsentierte Klassen; Sicherstellung vielfältiger, repräsentativer Quellen.

Warum: Trainingsdaten, die Gruppen unterrepräsentieren, erzeugen Modelle, die diese Gruppen unterversorgen. Beheben Sie dies auf der Datenebene, nicht auf der Modellebene.

Dokumentieren Sie den beabsichtigten Verwendungszweck, Trainingsdaten, Leistung, Einschränkungen und Risiken eines Modells für Governance und Audit.

Amazon SageMaker Model Cards — strukturierte, versionierte Dokumentation, die mit dem Modell verknüpft ist.

Beschränken Sie LLM-Themen, filtern Sie schädliche Inhalte, maskieren Sie PII oder blockieren Sie Prompt-Injection-Muster.

Amazon Bedrock Guardrails. Konfigurieren Sie verbotene Themen, Inhaltsfilter (Hass, Gewalt, sexuell, Beleidigungen), Wortfilter, Filter für sensible Informationen und kontextuelle Grounding-Checks.

Warum: Wird sowohl auf Eingaben als auch auf Ausgaben angewendet; funktioniert über jedes Bedrock-Modell und Ihre eigenen benutzerdefinierten Modelle hinweg.

Bestimmen Sie den Anteil der Sicherheitsverantwortung des Unternehmens für eine generative KI-Bereitstellung.

AWS Generative AI Security Scope Matrix. Scope 1 (Verbraucher-App, geringste Verantwortung) → Scope 5 (selbst trainiertes Modell, höchste Verantwortung).

Warum: Das Erstellen und Trainieren eines Modells von Grund auf mit privaten Daten überträgt die maximale Sicherheitsverantwortung auf das Unternehmen.

Stakeholder oder Regulierungsbehörden verlangen eine Erklärung, wie das Modell zu seinen Vorhersagen gelangt.

Verwenden Sie nach Möglichkeit interpretierbare Modelle (Entscheidungsbäume, lineare/logistische Regression). Für komplexe Modelle verwenden Sie Partial Dependence Plots, SHAP-Feature-Wichtigkeit über SageMaker Clarify oder SageMaker Model Cards.

Warum: PDPs zeigen den marginalen Effekt jedes Features; SHAP ordnet den Beitrag pro Vorhersage zu; Model Cards erfassen die gesamte Historie für Audits.

Generative KI-Ausgabe kann urheberrechtlich geschütztes Material reproduzieren oder als von Menschen erstellte Arbeit ausgegeben werden.

Plagiats- / IP-Verletzungsrisiko. Mildern Sie mit Zitationsanforderungen, Nachverfolgung der Content-Herkunft, Wasserzeichen, wo unterstützt, menschlicher Überprüfung und klaren Offenlegungsrichtlinien für KI-Inhalte.

Sicherheit, Compliance und Governance für KI-Lösungen

Die Foundation-Model-Anwendung muss Prompts und Antworten im AWS-Netzwerk halten — kein öffentlicher Internet-Egress.

Bedrock mit VPC-Endpunkten (PrivateLink) für die Runtime-API. Blockieren Sie öffentliche Bedrock-Endpunkte mit SCPs auf Organisationsebene.

Warum: PrivateLink hält Anfragen privat und verhindert, dass Daten die VPC verlassen; SCPs setzen die Regel kontoübergreifend durch.

Mehrere Teams rufen Bedrock mit gemeinsamen S3-Daten auf; jedes Team darf nur auf seine eigenen Kundendaten zugreifen.

Erstellen Sie pro Team eine IAM-Servicerolle, die Bedrock nur Zugriff auf das S3-Präfix oder den KMS-Schlüssel dieses Teams gewährt.

Warum: Benutzerdefinierte Servicerollen erzwingen das Prinzip der geringsten Rechte auf Ressourcenebene. Geben Sie Bedrock keinen breiten S3-Zugriff und verlassen Sie sich nicht auf App-Layer-Filterung.

Bedrock kann S3-Daten, die mit SSE-KMS verschlüsselt sind, nicht lesen.

Gewähren Sie der Bedrock-Servicerolle `kms:Decrypt` auf dem relevanten CMK und `s3:GetObject` auf dem Bucket/Präfix.

Warum: Bedrock nimmt seine Servicerolle an, um die Daten zu lesen; die Rolle benötigt sowohl S3- als auch KMS-Berechtigungen.

Erfassen Sie Bedrock-Aktivitäten für Monitoring, Debugging, Audit und Compliance.

Zwei komplementäre Dienste. CloudTrail = wer/wann/woher für jeden API-Aufruf (Identität, Zeitstempel, Quell-IP). Bedrock-Modell-Aufrufl-Logging = die eigentliche Prompt-/Response-Payload, geschrieben an CloudWatch Logs oder S3. Aktivieren Sie beides.

Warum: CloudTrail erfasst nur Metadaten; Aufrufl-Logging erfasst Inhalte. Compliance erfordert oft beides.

Der Prüfer fordert AWS-Compliance-Berichte (SOC, ISO, PCI, HIPAA) für die KI-Workload an.

AWS Artifact — Self-Service-Portal für On-Demand AWS-Compliance-Berichte und -Vereinbarungen.

Warum: AWS Audit Manager prüft Ihre Nutzung kontinuierlich; AWS Artifact bietet AWS' eigene Bestätigungen.

Entdecken und klassifizieren Sie PII oder andere sensible Daten in S3 (Trainingskorpora, Modellprotokolle).

Amazon Macie — ML-gesteuerte Erkennung sensibler Daten für S3.

Warum: Verwenden Sie Macie, um Daten zu finden, die maskiert, gelöscht oder mit KMS verschlüsselt werden müssen, bevor sie in einem Modell oder seinen Ausgaben landen.

Bösartige Benutzereingaben versuchen, System-Prompts zu überschreiben, Daten zu exfiltrieren oder unbeabsichtigte Aktionen auszulösen.

Mehrstufige Verteidigung: Bedrock Guardrails für Inhaltsfilterung, Prompt-Templates, die Überschreibungsmuster erkennen/ignorieren, Input-Längenbeschränkungen, Output-Validierung und Tool-Berechtigungen mit geringsten Rechten für Agents.

Warum: Keine einzelne Maßnahme ist ausreichend; kombinieren Sie Input-Filterung, Output-Filterung und Kapazitätsgrenzen.

Ein benutzerdefiniertes Modell wurde mit vertraulichen Daten trainiert, die nicht in die Antworten gelangen sollten.

Löschen Sie das Modell, entfernen Sie die vertraulichen Datensätze aus dem Trainingssatz und trainieren Sie neu. Output-Filterung ist nicht ausreichend.

Warum: In Modellgewichten eingebettetes Wissen kann bei der Inferenz nicht zuverlässig maskiert werden; nur ein erneutes Training ohne diese Daten entfernt es.

Entscheiden Sie, was AWS sichert vs. was der Kunde für eine KI-Workload sichert.

AWS Shared Responsibility Model: AWS = Sicherheit DER Cloud (Hardware, Hypervisor, Regionen). Kunde = Sicherheit IN der Cloud (Daten, IAM, KMS-Schlüssel, Netzwerk, App-Konfiguration).