🏠Главная 📚Сертификации 📱Мобильные приложения

🎓Об экзамене

✍️Блог 📊Прогресс 📅Календарь 💬Поддержка

Политика конфиденциальности Условия использования Свяжитесь с нами Политика файлов cookie Отказ от ответственности Доступность DMCA / Авторское право

Перейти к содержимому

AIF-C01Справочник

Справочник

AWS Certified AI Practitioner

Последняя проверка: апрель 2026 г.

Сжатый справочник архитектурных шаблонов, проверяемых на экзамене AIF-C01. Читайте сверху вниз или переходите к нужному разделу.

Разделы

Основы ИИ и машинного обучения11 записей
Основы генеративного ИИ14 записей
Применение базовых моделей14 записей
Руководство по ответственному ИИ7 записей
Безопасность, соответствие требованиям и управление для решений ИИ9 записей

Основы ИИ и машинного обучения

Выберите парадигму обучения: размеченные данные, неразмеченные данные или интерактивный метод проб и ошибок.

Размеченные → обучение с учителем. Неразмеченные кластеризация/сегментация → обучение без учителя. Агент обучается по вознаграждению → обучение с подкреплением.

Почему: Выбор диктуется существующими данными. RLHF — это обучение с подкреплением, управляемое оценками человека, используемое для выравнивания LLM.

Источник

Адаптируйте предварительно обученную модель к новой связанной задаче вместо обучения с нуля.

Используйте transfer learning. Выполните fine-tune существующей модели на новом наборе данных предметной области.

Почему: Повторно использует изученные представления, сокращает время обучения и потребности в данных по сравнению с созданием модели с нуля.

Выберите режим вывода SageMaker для формы рабочей нагрузки.

Стабильная низкая задержка → real-time. Пиковый/холостой трафик → serverless. Большая полезная нагрузка (≤1 ГБ) или длительная задача (≤1 ч) с почти real-time → asynchronous. Автономная массовая обработка → batch transform.

Почему: Real-time имеет ограничения по полезной нагрузке/таймауту; async ставит в очередь большие задачи; batch используется для периодической автономной оценки.

Источник

Несколько команд ML должны совместно использовать и повторно использовать спроектированные признаки.

Amazon SageMaker Feature Store как центральное хранилище для online и offline признаков.

Почему: Избегает дублирования проектирования признаков и поддерживает согласованность train/serve между командами.

Источник

Создавайте модели ML без кодирования или опыта в ML (например, прогнозирование спроса для аналитиков).

Amazon SageMaker Canvas — визуальный no-code интерфейс для обучения и вывода.

Источник

Быстро разверните базовую модель внутри VPC.

Amazon SageMaker JumpStart — предварительно обученные модели развертываются как конечные точки SageMaker в вашей VPC.

Почему: JumpStart объединяет артефакты моделей и ноутбуки для развертывания в VPC одним щелчком мыши.

Источник

Автоматизируйте настройку гиперпараметров и выбор модели.

Amazon SageMaker Autopilot — исследует алгоритмы и автоматически настраивает гиперпараметры.

Источник

Выберите правильную метрику оценки для модели классификации.

Правильность классификации изображений/бинарной классификации → accuracy. Распределение по классам → confusion matrix. Несбалансированные классы → F1, precision, recall. Независимость от порога → AUC.

Почему: Accuracy вводит в заблуждение на несбалансированных данных; confusion matrix показывает количество TP/FP/TN/FN; F1 балансирует precision и recall.

Стоимость пропуска положительного результата (ложноотрицательного) намного выше, чем ложноположительного — например, обнаружение мошенничества, скрининг заболеваний.

Оптимизируйте recall (чувствительность). Допустите более низкую precision.

Почему: Recall = TP / (TP + FN). Максимизация recall минимизирует пропущенные положительные результаты ценой большего количества ложных срабатываний.

Модель показывает высокие результаты на обучающих данных, но плохие на тестовых/производственных данных; или точность сначала улучшается, затем ухудшается по мере роста эпох.

Переобучение. Смягчите с помощью увеличения данных, регуляризации, early stopping, dropout или более простой модели.

Почему: Большой разрыв между обучающими и тестовыми данными означает, что модель запомнила шум вместо изучения закономерностей.

Выберите управляемый сервис ИИ для одноцелевой задачи.

NLP/настроение/сущности → Comprehend. Речь в текст → Transcribe. Текст в речь → Polly. Перевод → Translate. Чат-бот/голосовой интерфейс → Lex. Изображения/видео → Rekognition. Извлечение текста из документов/PDF → Textract. Рекомендации → Personalize. Прогнозирование → Forecast.

Почему: Управляемые сервисы ИИ превосходят пользовательские модели, когда задача четко определена и есть в каталоге.

Источник

Основы генеративного ИИ

Создайте приложение генеративного ИИ на AWS без управления инфраструктурой модели.

Amazon Bedrock — полностью управляемый доступ к базовым моделям (Anthropic Claude, Meta Llama, Amazon Titan, Stability, AI21, Mistral, Cohere) через единый API.

Почему: Нет предоставления GPU, нет хостинга моделей; оплата за токен. SageMaker JumpStart — это альтернатива, когда вам нужна самостоятельно размещенная конечная точка в вашей VPC.

Источник

Определите, что делает модель "базовой моделью".

Большая модель, предварительно обученная на разнообразных, в основном неразмеченных данных; адаптируемая ко многим последующим задачам посредством prompting, fine-tuning или RAG.

Оцените, сколько ввода помещается в один промпт и что влияет на стоимость вывода.

Токены — это подъязыковые единицы. Окно контекста = максимальное количество токенов на запрос (ввод + вывод). Стоимость вывода примерно пропорциональна обработанным токенам.

Почему: Количество токенов, а не количество запросов, определяет ценообразование Bedrock. Если длинный документ превышает окно контекста, разделите его на части или выберите модель с большим окном.

Выберите стиль вывода: детерминированный или креативный.

Низкая температура (~0.0–0.3) → детерминированный, повторяемый. Высокая температура (~0.7–1.0) → креативный, разнообразный. Используйте 0 для классификации или определения настроения, чтобы получить согласованные метки.

Ограничьте пул токенов-кандидатов помимо температуры.

Top-K = рассмотрите только K наиболее вероятных токенов. Top-P (ядро) = рассмотрите токены, пока кумулятивная вероятность не достигнет P.

Почему: Top-P адаптирует размер набора кандидатов к форме распределения; Top-K имеет фиксированную ширину.

Получите вывод LLM в определенном стиле, длине или языке.

Prompt engineering. Добавьте явные инструкции ("Ответьте по-французски, менее 50 слов, официальный тон").

Почему: Дешевле и быстрее, чем fine-tuning, переобучение или изменение размера модели для стилистического контроля.

Повысьте точность LLM для конкретной задачи без переобучения.

Few-shot prompting — встройте 2–5 размеченных примеров ввода/вывода в промпт перед новым вводом.

Почему: In-context learning позволяет модели сопоставлять шаблоны с примерами без обновления весов.

LLM дает неправильные ответы на многошаговые задачи рассуждения.

Chain-of-thought prompting — проинструктируйте модель пройти через этапы рассуждения перед окончательным ответом ("Давайте подумаем шаг за шагом").

LLM генерирует текст, который звучит правдоподобно, но фактически неверен или сфабрикован.

Галлюцинации. Смягчите с помощью RAG (основанного на извлеченных фактах), Bedrock Guardrails, более низкой температуры и проверки человеком важных результатов.

Используйте для семантического поиска, кластеризации или извлечения RAG по текстовым или мультимодальным данным.

Используйте модель встраивания (например, Titan Embeddings, Cohere Embed) для преобразования контента в плотные векторы. Храните и запрашивайте в векторной БД.

Почему: Встраивания захватывают семантическое значение, поэтому похожие элементы располагаются близко друг к другу в векторном пространстве (косинусное сходство / сходство скалярного произведения).

Источник

Поисковое приложение принимает как текст, так и изображения в качестве входных данных.

Мультимодальная модель встраивания (например, Titan Multimodal Embeddings) — проецирует текст и изображения в одно и то же векторное пространство.

Источник

Быстро создайте прототип приложения генеративного ИИ без кода или настройки учетной записи AWS.

PartyRock (Amazon Bedrock Playground) — браузерный no-code конструктор приложений.

Источник

Выберите модель ценообразования Bedrock.

Переменная/непредсказуемая нагрузка → On-demand (за токен). Стабильный большой объем или гарантированная пропускная способность → Provisioned Throughput. Пользовательские fine-tuned модели → должны использовать Provisioned Throughput.

Почему: On-demand не требует обязательств; Provisioned Throughput покупает выделенную мощность в единицах модели.

Источник

Выберите самую дешевую настройку, которая обеспечит необходимое качество.

Попробуйте в следующем порядке: (1) prompt engineering, (2) RAG с базой знаний, (3) fine-tuning, (4) продолженное предварительное обучение.

Почему: Усилия и затраты растут на каждом шаге. Остановитесь на первом, который соответствует требованиям.

Применение базовых моделей

Расширьте базовую модель частными данными компании (PDF, документы, контент S3) без fine-tuning.

Создайте базу знаний Amazon Bedrock. Bedrock обрабатывает прием, разбиение на части, встраивание и извлечение (RAG) во время вывода.

Почему: Дешевле и быстрее обновлять, чем fine-tuning. Изменение исходных данных → повторная синхронизация базы знаний; без переобучения.

Источник

Данные часто меняются (инвентарь, цены, новости), и модель должна отражать текущее состояние.

RAG с базой знаний. Избегайте fine-tuning — циклы переобучения не могут угнаться за изменениями.

Почему: RAG отделяет модель от данных; база знаний обновляется независимо от модели.

Выполните fine-tune базовой модели с размеченными примерами для конкретной задачи.

Предоставьте пары prompt-completion (инструкция-ответ). Формат JSONL является стандартным.

Почему: Instruction fine-tuning учит модель сопоставлять пользовательские вводы с желаемыми выводами в целевой задаче.

Источник

Обучите базовую модель специализированному словарю (медицинскому, юридическому, научному), используя много неразмеченного текста предметной области.

Продолженное предварительное обучение на неразмеченном корпусе предметной области.

Почему: Продолженное предварительное обучение обновляет понимание моделью словарного запаса и концепций; instruction fine-tuning учит поведению в задаче. Разная цель, разная форма данных.

Источник

Многошаговый рабочий процесс, который объединяет рассуждения LLM с вызовами внешних API, баз данных или сервисов AWS.

Amazon Bedrock Agents — оркестрирует рассуждения LLM, вызов инструментов/API и синтез результатов в единой управляемой среде выполнения.

Почему: Агенты планируют шаги, вызывают инструменты и объединяют результаты в окончательный ответ без необходимости написания цикла оркестровки.

Источник

Выберите векторную базу данных для встраиваний.

Управляемый RAG → Bedrock Knowledge Bases (автоматически управляет векторным хранилищем). Пользовательская векторная БД → OpenSearch Service (k-NN), Aurora PostgreSQL с pgvector, Neptune Analytics или RDS for PostgreSQL с pgvector.

Почему: OpenSearch является стандартным для высокомасштабного k-NN; pgvector повторно использует существующую реляционную БД.

Источник

Разверните fine-tuned модель из Bedrock для производственного обслуживания.

Купите Provisioned Throughput для пользовательской модели Bedrock. Пользовательские модели не могут быть вызваны с помощью ценообразования on-demand.

Почему: Мощность пользовательской модели выделена, оплачивается в единицах модели и требуется для вызова.

Источник

Оцените или уменьшите стоимость вывода Bedrock.

Стоимость ≈ обработанные токены × тариф за токен. Уменьшите, сокращая промпты, урезая few-shot примеры, выбирая меньшие модели или используя кэширование промптов, где это поддерживается.

Источник

Генерируйте высокоточные размеченные данные с проверкой человеком (например, специализированные изображения, медицинские записи).

Amazon SageMaker Ground Truth Plus — управляемая рабочая сила для разметки данных (HITL).

Почему: Для периодического аудита предсказаний модели с низкой уверенностью используйте в паре с Amazon A2I (Augmented AI).

Источник

Распознавание речи неправильно слышит термины, специфичные для предметной области (медицинские, юридические, названия брендов).

Amazon Transcribe с пользовательской языковой моделью или пользовательским словарем, обученным на тексте предметной области.

Источник

Модель хорошо работает на обучении, но плохо в производстве (переобучение) — увеличьте обобщающую способность без изменения архитектуры.

Увеличьте объем и разнообразие обучающих данных. Не уменьшайте данные и не добавляйте только гиперпараметры.

Почему: Более репрезентативные данные — это наиболее эффективное решение; регуляризация и early stopping помогают, но данные доминируют.

Оцените качество генеративного вывода.

Качество перевода → BLEU. Качество суммаризации → ROUGE. Семантическое сходство с эталоном → BERTScore. Стилистические предпочтения → человеческая оценка с пользовательскими наборами промптов.

Выберите базовую модель Bedrock для варианта использования, где важен стиль вывода.

Проведите человеческую оценку пользовательского набора данных промптов для моделей-кандидатов. Не полагайтесь только на публичные таблицы лидеров или метрики задержки.

Почему: Соответствие стиля/тона является субъективным; бенчмарки этого не учитывают.

Источник

Генерируйте диаграммы и дашборды из вопросов на естественном языке по бизнес-данным.

Amazon Q в QuickSight — BI на естественном языке поверх наборов данных QuickSight.

Источник

Руководство по ответственному ИИ

Обнаружьте предвзятость в обучающих данных или предсказаниях модели; создайте отчеты по объяснимости.

Amazon SageMaker Clarify. Вычисляет метрики предвзятости по защищенным атрибутам до и после обучения, а также атрибуцию признаков на основе SHAP.

Почему: Требуется для регулируемых областей (кредитование, найм, здравоохранение), где вы должны демонстрировать справедливость и объяснимость.

Источник

Модель работает хуже для одной демографической, этнической группы или географии (например, непропорционально отмечает определенные группы).

Предвзятость выборки. Перебалансируйте набор данных: дополнение данных для недопредставленных классов; обеспечьте разнообразные, репрезентативные источники.

Почему: Обучающие данные, которые недопредставляют группы, производят модели, которые недостаточно обслуживают их. Исправляйте на уровне данных, а не на уровне модели.

Документируйте предполагаемое использование модели, обучающие данные, производительность, ограничения и риски для управления и аудита.

Amazon SageMaker Model Cards — структурированная, версионированная документация, привязанная к модели.

Источник

Ограничьте темы LLM, отфильтруйте вредоносный контент, замаскируйте PII или заблокируйте шаблоны prompt injection.

Amazon Bedrock Guardrails. Настройте запрещенные темы, фильтры контента (ненависть, насилие, сексуальный контент, оскорбления), словесные фильтры, фильтры конфиденциальной информации и проверки контекстуальной обоснованности.

Почему: Применяется как к входам, так и к выходам; работает с любой моделью Bedrock и вашими собственными пользовательскими моделями.

Источник

Определите долю ответственности компании за безопасность при развертывании генеративного ИИ.

Матрица области безопасности генеративного ИИ AWS. Область 1 (потребительское приложение, наименьшая ответственность) → Область 5 (самостоятельно обученная модель, наибольшая ответственность).

Почему: Создание и обучение модели с нуля на частных данных возлагает максимальную ответственность за безопасность на компанию.

Источник

Заинтересованные стороны или регуляторы требуют объяснения того, как модель достигает своих предсказаний.

Используйте интерпретируемые модели, когда это возможно (деревья решений, линейная/логистическая регрессия). Для сложных моделей используйте Partial Dependence Plots, важность признаков SHAP через SageMaker Clarify или SageMaker Model Cards.

Почему: PDP показывают предельный эффект каждого признака; SHAP приписывает вклад каждому предсказанию; Model Cards фиксируют всю историю для аудита.

Вывод генеративного ИИ может воспроизводить материалы, защищенные авторским правом, или выдаваться за работу, созданную человеком.

Риск плагиата / нарушения ИС. Смягчите с помощью требований к цитированию, отслеживания происхождения контента, водяных знаков (где поддерживается), человеческого обзора и четких политик раскрытия контента ИИ.

Безопасность, соответствие требованиям и управление для решений ИИ

Приложение базовой модели должно сохранять промпты и ответы в сети AWS — без выхода в публичный интернет.

Bedrock с конечными точками VPC (PrivateLink) для API среды выполнения. Заблокируйте публичные конечные точки Bedrock с помощью SCP на уровне организации.

Почему: PrivateLink сохраняет запросы частными и предотвращает выход данных из VPC; SCP обеспечивают соблюдение правила во всех учетных записях.

Источник

Несколько команд вызывают Bedrock для общих данных S3; каждая команда должна получать доступ только к своим собственным клиентским данным.

Создайте одну сервисную роль IAM для каждой команды, которая предоставляет Bedrock доступ только к префиксу S3 или ключу KMS этой команды.

Почему: Пользовательские сервисные роли обеспечивают наименьшие привилегии на уровне ресурсов. Не предоставляйте Bedrock широкий доступ к S3 и не полагайтесь на фильтрацию на уровне приложения.

Bedrock не может читать данные S3, зашифрованные с помощью SSE-KMS.

Предоставьте сервисной роли Bedrock разрешение `kms:Decrypt` на соответствующий CMK и `s3:GetObject` на бакет/префикс.

Почему: Bedrock принимает свою сервисную роль для чтения данных; роли нужны разрешения как S3, так и KMS.

Источник

Захватывайте активность Bedrock для мониторинга, отладки, аудита и соответствия требованиям.

Два взаимодополняющих сервиса. CloudTrail = кто/когда/откуда для каждого вызова API (идентификатор, временная метка, исходный IP). Ведение журнала вызовов модели Bedrock = фактическая полезная нагрузка промпта/ответа, записываемая в CloudWatch Logs или S3. Включите оба.

Почему: CloudTrail фиксирует только метаданные; ведение журнала вызовов фиксирует контент. Соответствие требованиям часто требует обоих.

Источник

Аудитор запрашивает отчеты AWS о соответствии требованиям (SOC, ISO, PCI, HIPAA) для рабочей нагрузки ИИ.

AWS Artifact — портал самообслуживания для получения отчетов и соглашений AWS о соответствии требованиям по запросу.

Почему: AWS Audit Manager постоянно аудирует ваше использование; AWS Artifact предоставляет собственные аттестации AWS.

Источник

Обнаружьте и классифицируйте PII или другие конфиденциальные данные, хранящиеся в S3 (обучающие корпуса, журналы моделей).

Amazon Macie — обнаружение конфиденциальных данных в S3 на основе ML.

Почему: Используйте Macie для поиска данных, которые требуют маскирования, удаления или шифрования KMS, прежде чем они попадут в модель или ее выходы.

Источник

Вредоносный ввод пользователя пытается переопределить системный промпт, извлечь данные или запустить непреднамеренные действия.

Глубокая защита: Bedrock Guardrails для фильтрации контента, шаблоны промптов, которые обнаруживают/игнорируют шаблоны переопределения, ограничения длины ввода, валидация вывода и разрешения инструментов с минимальными привилегиями для агентов.

Почему: Ни одно отдельное смягчение недостаточно; комбинируйте фильтрацию ввода, фильтрацию вывода и ограничения возможностей.

Пользовательская модель была обучена на конфиденциальных данных, которые не должны просачиваться в ответы.

Удалите модель, очистите конфиденциальные записи из обучающего набора и переобучите. Фильтрация вывода недостаточна.

Почему: Знания, заложенные в веса модели, не могут быть надежно замаскированы при выводе; только переобучение без этих данных удаляет их.

Определите, что защищает AWS, а что защищает клиент для рабочей нагрузки ИИ.

Модель общей ответственности AWS: AWS = безопасность ОБЛАКА (оборудование, гипервизор, регионы). Клиент = безопасность В ОБЛАКЕ (данные, IAM, ключи KMS, сеть, конфигурация приложения).

Источник