C1000-185Справочник

Справочник — C1000-185 IBM Certified watsonx Generative AI Engineer - Associate

Последняя проверка: июнь 2026 г.

Сжатый справочник архитектурных шаблонов, проверяемых на экзамене C1000-185. Читайте сверху вниз или переходите к нужному разделу.

Базовые модели и проектирование промптов

Предприятию нужна модель, следующая инструкциям, с разрешительной лицензией и возмещением убытков.

Выберите модель IBM Granite instruct из каталога watsonx.ai вместо сторонней размещенной модели.

Почему: Модели Granite разработаны IBM, управляются IBM и сопровождаются возмещением убытков за интеллектуальную собственность IBM — это безопасный выбор по умолчанию для регулируемых рабочих нагрузок.

Источник

Выбор между вариантом, настроенным для чата, и вариантом, настроенным для инструкций, для задачи однократной извлечения.

Используйте вариант instruct с четким директивным промптом; зарезервируйте модели чата для многошагового диалога.

Почему: Модели чата ожидают ролевых ходов; для одноразовых задач модель instruct проще и дешевле.

Выходные данные должны быть детерминированными и воспроизводимыми для отчета о соответствии.

Установите жадное декодирование (без сэмплирования), чтобы всегда выбирался токен с наибольшей вероятностью.

Почему: Жадное декодирование устраняет случайность; сэмплирование с температурой вносит вариации, которые не нужны в проверяемых выходных данных.

Источник

Генерация творческого текста кажется повторяющейся и пресной.

Переключитесь на сэмплирующее декодирование и повысьте температуру (например, 0.7-1.0), чтобы расширить распределение токенов.

Почему: Более высокая температура выравнивает вероятности, поэтому выбираются токены с более низким рангом, увеличивая разнообразие.

Выходные данные сэмплирования иногда отклоняются от темы с редкими токенами.

Ограничьте сэмплирование с помощью top-k или top-p (ядра), чтобы ограничить кандидатов наиболее вероятными токенами.

Почему: top-k ограничивает количество кандидатов; top-p ограничивает кумулятивную массу вероятности — оба обрезают длинный хвост, который вызывает дрейф.

Модель зацикливается, повторяя одну и ту же фразу или предложение.

Увеличьте параметр штрафа за повторение, чтобы препятствовать повторному излучению недавних токенов.

Почему: Штраф снижает вероятность уже увиденных токенов; только стоп-последовательности не исправляют зацикливания в середине генерации.

Генерация выходит за пределы ответа и переходит в галлюцинированный последующий текст.

Определите одну или несколько стоп-последовательностей (например, "\n\n", "###"), чтобы генерация останавливалась на известной границе.

Почему: Стоп-последовательности завершают вывод детерминированно; полагаться только на максимальное количество токенов — значит обрезать предложение на полуслове.

Ответы обрезаются до завершения запрошенного JSON.

Увеличьте max new tokens; установите min new tokens, чтобы при необходимости принудительно задать ответ минимальной длины.

Почему: max new tokens ограничивает длину вывода; если значение слишком низкое, оно обрезает структурированный вывод до закрывающей скобки.

Классификация без примеров ошибочно маркирует крайние случаи.

Добавьте несколько помеченных примеров ввода/вывода (few-shot) непосредственно в промпт.

Почему: Примеры few-shot устанавливают формат вывода и границу принятия решения в контексте без какой-либо настройки.

Команда хочет доработать промпт, прежде чем писать какой-либо код.

Используйте Prompt Lab — переключайтесь между свободным, структурированным и чат-режимами, настраивайте параметры, затем сохраняйте как шаблон промпта.

Почему: Prompt Lab — это поверхность для итераций без кода; структурированный режим чисто разделяет инструкции, примеры и ввод.

Источник

Длинные документы превышают контекстное окно выбранной модели.

Разбейте документы на части и извлекайте только релевантные отрывки (RAG) или выберите модель с более длинным контекстом из каталога.

Почему: Вы не можете превысить лимит токенов модели; вставка большего количества текста молча приводит к отбрасыванию или ошибкам — извлечение является масштабируемым решением.

Обучение, тонкая настройка и оценка моделей

Проектирование промптов достигает плато в узкой предметной области, которая требует согласованного стиля.

Выполните настройку промпта в Tuning Studio, чтобы обучить мягкий промпт (настроенный вектор) на размеченных примерах.

Почему: Настройка промптов адаптирует поведение без изменения базовых весов — это дешевле, чем fine-tuning, и надежнее, чем длинные промпты.

Источник

Модель не обладает актуальными фактическими корпоративными знаниями.

Используйте RAG для обоснования ответов на основе извлеченных документов, а не для настройки модели на этих фактах.

Почему: Настройка обучает стилю/поведению, а не новым фактам; RAG вводит текущий обоснованный контекст и легко обновляется.

Выбор между настройкой промпта и полной тонкой настройкой для проекта watsonx уровня специалиста.

Предпочтите настройку промпта: она тренирует значительно меньше параметров, работает быстрее и является поддерживаемым путем в Tuning Studio.

Почему: Полная тонкая настройка является дорогостоящей, требует больших наборов данных и несет риск катастрофического забывания; настройка промпта — это стандартный подход watsonx.

Подготовка данных для настройки промпта модели суммаризации.

Предоставьте пары вход/выход в ожидаемом формате JSON/JSONL, разделенные на обучающие и валидационные наборы.

Почему: Чистые, репрезентативные пары определяют качество настройки; для оценки обобщения необходим отложенный валидационный набор.

Кривая потерь настройки рано выравнивается, в то время как потери валидации начинают расти.

Остановите или уменьшите количество эпох — модель начинает переобучаться на обучающем наборе.

Почему: Расходящиеся потери обучения/валидации — это классический сигнал переобучения; больше эпох приведут к запоминанию, а не к обобщению.

Результаты настройки промптов нестабильны между запусками.

Настройте скорость обучения, количество эпох, размер батча и количество виртуальных токенов в конфигурации настройки.

Почему: Слишком высокая скорость обучения дестабилизирует обучение; это рычаги, которые Tuning Studio предоставляет для сходимости.

Необходимо объективно сравнить два промпта или настроенных актива.

Оцените с помощью метрик задачи (например, ROUGE/BLEU для суммаризации, exact-match/F1 для извлечения) плюс человеческий обзор.

Почему: Качество генерации многомерно; автоматизированные метрики выявляют регрессии, но человеческий обзор оценивает достоверность.

Настроенная модель по-прежнему выдумывает факты, отсутствующие в источнике.

Обоснуйте с помощью RAG, понизьте температуру и проинструктируйте модель отвечать только на основе предоставленного контекста или говорить, что она не знает.

Почему: Галлюцинации — это проблема обоснования и декодирования, а не проблема весов; извлечение плюс ограничения исправляют большую часть.

Для адаптации доступно всего несколько десятков размеченных примеров.

Оставайтесь с few-shot промптингом или легкой настройкой промпта; не выполняйте fine-tuning на крошечных данных.

Почему: Маленькие наборы данных плохо переобучаются при полной тонкой настройке; внутриконтекстные примеры лучше обобщаются в этом масштабе.

Выбор базовой модели для настройки промпта для задачи классификации.

Выберите настраиваемую базовую модель Granite, которую Tuning Studio поддерживает для настройки промпта, соответствующую размеру задачи.

Почему: Не каждая модель каталога настраиваема; настройка меньшей поддерживаемой модели дешевле и часто достаточна для классификации.

Качество генеративных выходных данных должно непрерывно отслеживаться в производстве.

Настройте метрики оценки watsonx.governance (качество, дрейф, метрики генеративного ИИ) для развертывания.

Почему: Управление превращает одноразовую оценку в контролируемые пороги с оповещениями, а не в ручную выборочную проверку.

Один и тот же настроенный промпт должен обслуживать множество входных данных с разными полями.

Параметризуйте шаблон промпта именованными переменными и предоставляйте значения во время вывода.

Почему: Переменные сохраняют один многоразовый шаблон вместо жесткого кодирования входов, и они чисто сопоставляются с параметрами API.

Модель игнорирует инструкцию задачи и просто продолжает текст.

Используйте модель, настроенную на инструкции, и сформулируйте промпт как явную директиву, а не как фрагмент для завершения.

Почему: Базовые модели завершения продолжают паттерн; модели instruct обучены следовать директивам.

Управление данными с помощью watsonx.data

Необходимо выполнять интерактивные SQL-запросы к данным объектного хранилища для подготовки функций ИИ.

Используйте движок watsonx.data Presto поверх таблиц Iceberg в объектном хранилище.

Почему: Presto обеспечивает быстрый федеративный SQL для открытых форматов таблиц без копирования данных в хранилище.

Источник

Аналитические данные требуют эволюции схемы и возможности "путешествия во времени" в озере данных.

Храните их как таблицы Apache Iceberg, управляемые watsonx.data.

Почему: Iceberg поддерживает эволюцию схемы, снимки и операции ACID на объектном хранилище — это стандарт для озера данных.

Выбор движка для тяжелой ETL-трансформации против специальных запросов.

Используйте Spark для крупномасштабных пакетных преобразований/ETL; используйте Presto для интерактивных SQL-запросов с низкой задержкой.

Почему: Spark масштабирует пакетные вычисления; Presto оптимизирован для быстрых федеративных запросов — выбирайте по форме рабочей нагрузки.

RAG требует векторного хранилища для эмбеддингов, расположенного совместно с управляемыми данными.

Разверните Milvus внутри watsonx.data в качестве векторной базы данных для поиска сходства.

Почему: Milvus — это интегрированное векторное хранилище watsonx.data; хранение эмбеддингов в озере данных упрощает управление.

Источник

Выбор между Milvus и watsonx Discovery для извлечения.

Используйте Milvus для необработанного векторного сходства, которое вы контролируете; используйте watsonx Discovery (на основе Elasticsearch) для управляемого корпоративного поиска с гибридным извлечением.

Почему: Milvus — это векторная база данных, которой вы управляете; Discovery — это поисковый сервис более высокого уровня с встроенными функциями приема и ранжирования.

Подготовка документов, чтобы базовая модель могла обосновывать на них ответы.

Разбейте документы на части, сгенерируйте эмбеддинги с помощью модели эмбеддингов watsonx.ai и проиндексируйте их в Milvus.

Почему: Качество извлечения зависит от разумного разбиения на части и соответствующей модели эмбеддингов; несоответствие размерностей нарушает индекс.

Функции ИИ нужны данные, распределенные по нескольким базам данных и хранилищам.

Зарегистрируйте источники в watsonx.data и запрашивайте их на месте через федерацию движка.

Почему: Федерация избегает дорогостоящего дублирования данных и поддерживает единую управляемую точку доступа.

Команда управления требует прослеживаемости и контроля доступа к данным, поступающим в модели.

Каталогизируйте наборы данных в каталоге watsonx.data и примените доступ на основе IAM/политик.

Почему: Управляемый каталог — это то, что связывает происхождение данных с паспортами моделей позже — нерегламентированный доступ к хранилищу обходит его.

Проект watsonx.ai должен считывать курированные таблицы озера данных для RAG.

Добавьте подключение watsonx.data к проекту и ссылайтесь на таблицы как на активы данных.

Почему: Подключения предоставляют управляемые данные озера данных проекту ИИ без экспорта копий.

Развертывание и интеграция решений GenAI

Рабочий промпт Prompt Lab должен стать многократно используемым, развертываемым активом.

Сохраните его как актив шаблона промпта в проекте, затем перенесите его в пространство развертывания.

Почему: Пространства развертывания — это граница производства; промпты должны быть перенесены туда, прежде чем они смогут быть использованы.

Приложению нужна конечная точка вывода с низкой задержкой для настроенного промпта.

Создайте онлайн-развертывание в пространстве развертывания; оно предоставляет REST-конечную точку для оценки/генерации.

Почему: Онлайн-развертывания предоставляют синхронную конечную точку; пакетные развертывания предназначены для оффлайн-заданий оценки.

Источник

Вызов базовой модели из кода Python-приложения.

Используйте класс ModelInference из Python SDK watsonx.ai и вызовите generate_text с вашими параметрами.

Почему: ModelInference объединяет аутентификацию, идентификатор модели, проект/пространство и параметры в одном клиенте — это чище, чем "сырой" REST.

Источник

Сервис, не написанный на Python, должен вызывать вывод watsonx.ai.

Вызовите REST-конечную точку watsonx.ai для генерации текста с идентификатором модели, входными данными и параметрами в теле JSON.

Почему: REST API не зависит от языка; SDK — это просто оболочка над теми же конечными точками.

Аутентификация вызовов SDK или API к watsonx.ai.

Обменяйте ключ API IBM Cloud IAM на токен носителя, затем вызовите конечную точку с этим токеном и идентификатором вашего проекта/пространства.

Почему: watsonx использует IBM Cloud IAM; встраивание "сырого" ключа API в каждый вызов или жесткое кодирование токенов неправильно и небезопасно.

Источник

Определение места хранения актива модели во время разработки и во время обслуживания.

Разрабатывайте и экспериментируйте в проекте; перенесите актив в пространство развертывания, чтобы его обслуживать.

Почему: Проекты — это песочницы для совместной разработки; пространства развертывания содержат активы, перенесенные в производство и контролируемые по доступу.

Включение извлечения и генерации в единый поток приложения.

Встройте запрос, извлеките top-k фрагментов из Milvus/Discovery, вставьте их в шаблон промпта, затем вызовите развернутую модель.

Почему: Порядок "извлечь, затем сгенерировать" обосновывает ответ; вызов модели первым обходит RAG.

Обзор и архитектура платформы watsonx

Сопоставление рабочей нагрузки GenAI с семейством продуктов watsonx.

Создавайте и настраивайте в watsonx.ai, храните/запрашивайте данные в watsonx.data, управляйте и отслеживайте в watsonx.governance.

Почему: Три компонента являются взаимодополняющими, а не взаимозаменяемыми — знание того, какой из них что делает, является ключевым знанием для экзамена.

Источник

Предприятию нужен watsonx локально по причинам резидентности данных.

Разверните watsonx как программное обеспечение на Cloud Pak for Data (Red Hat OpenShift), а не как SaaS-предложение IBM Cloud.

Почему: SaaS работает в IBM Cloud; программный фактор работает в вашем собственном кластере OpenShift для нужд резидентности/изоляции.

Организация совместной работы над GenAI и ее артефактами.

Используйте проект watsonx в качестве рабочей области, которая содержит активы данных, ноутбуки, промпты и настроенные модели с общим доступом.

Почему: Проекты — это единица сотрудничества и определения области активов; пространства развертывания являются отдельными и ориентированными на производство.

Контроль доступа к экземплярам и активам watsonx.

Используйте учетные записи IBM Cloud, группы ресурсов и политики/роли доступа IAM для определения области доступа.

Почему: Доступ в watsonx управляется IAM на уровне учетной записи/группы ресурсов — а не только специальным доступом к каждому активу.

Оценка стоимости выполнения вывода базовой модели.

Учитывайте оплату на основе токенов для вывода watsonx.ai плюс предоставленные движки/хранилища в watsonx.data.

Почему: Стоимость GenAI в основном определяется входными/выходными токенами; вычисления озера данных и векторного хранилища являются отдельными статьями расходов.

Проектирование производственной архитектуры RAG на watsonx.

Данные озера данных → эмбеддинги в Milvus → извлечение + генерация watsonx.ai → приложение, с непрерывным мониторингом watsonx.governance.

Почему: Этот сквозной поток является каноническим эталонным шаблоном watsonx, который экзамен ожидает от вас распознать.

Управление, соответствие нормативным требованиям и ответственный ИИ

Аудиторы запрашивают запись о жизненном цикле и происхождении развернутой модели.

Используйте паспорта ИИ watsonx.governance для сбора метаданных модели, ее происхождения и утверждений на протяжении всего жизненного цикла.

Почему: Паспорта — это система учета watsonx для происхождения моделей — документированный ответ на вопрос "откуда взялась эта модель".

Источник

Выходные данные производственной модели со временем ухудшаются.

Настройте мониторы дрейфа и качества watsonx.governance с порогами и оповещениями для развертывания.

Почему: Непрерывный мониторинг обнаруживает дрейф до того, как это сделают пользователи; однократная валидация не может обнаружить ухудшение после развертывания.

Модель должна быть проверена на несправедливое отношение к защищенным группам.

Выполните оценки справедливости/предвзятости в watsonx.governance и задокументируйте смягчение в паспорте.

Почему: Обязательства по ответственному ИИ требуют измеренной, задокументированной справедливости — а не просто неизмеренного предположения о справедливости.

Команде по соответствию необходимо сопоставить систему GenAI с регулированием ИИ.

Используйте watsonx.governance для отслеживания рисков, связывания средств контроля с нормативными актами и ведения готовых к аудиту доказательств.

Почему: Управление связывает риск модели с регулятивными контролями в одном месте, что требуется аудитами и принципами ответственного ИИ IBM.