Справочник

Google Cloud Generative AI Leader

Последняя проверка: май 2026 г.

Сжатый справочник архитектурных шаблонов, проверяемых на экзамене GAIL. Читайте сверху вниз или переходите к нужному разделу.

Домен 1: Основы генеративного ИИ

Различение типов ИИ для конкретного бизнес-сценария.

Используйте генеративный ИИ для создания контента (текста, изображений, кода). Используйте традиционный/дискриминативный ИИ для классификации, прогнозирования и анализа существующих данных.

Почему: Генеративный ИИ *создает* новый, оригинальный контент. Традиционный ИИ *анализирует* или *категоризирует* существующие данные. Это фундаментальное понятие.

Принятие решения о создании модели с нуля или использовании предварительно обученной.

Используйте базовые модели (например, Gemini), предварительно обученные на огромных, разнообразных наборах данных, и адаптируйте их для конкретных задач.

Почему: Базовые модели значительно сокращают время разработки и затраты ресурсов, предоставляя мощную универсальную основу, которую можно специализировать посредством промптинга или тонкой настройки.

Решение должно понимать и обрабатывать комбинации текста, изображений, аудио или видео.

Используйте мультимодальную базовую модель, такую как Gemini, которая может нативно рассуждать о различных типах данных в одном промпте.

Почему: Мультимодальные модели избегают сложности соединения отдельных моделей для каждого типа данных, обеспечивая более сложное, кросс-доменное понимание.

Большая языковая модель (LLM) уверенно генерирует правдоподобную, но фактически неверную информацию.

Внедрите методы обоснования, в первую очередь генерацию с дополненным извлечением (RAG), чтобы связать модель с проверяемыми источниками данных.

Почему: Галлюцинации являются неотъемлемым риском. Обоснование привязывает ответы модели к источнику истины, что делает его основной стратегией повышения фактической точности.

Понимание основной технологии, которая позволяет современным LLM понимать контекст.

Архитектура Transformer с ее механизмом самовнимания позволяет модели взвешивать важность всех слов во входных данных относительно друг друга.

Почему: Самовнимание — это ключевое новшество, которое позволяет LLM понимать долгосрочные зависимости и контекст, в отличие от более старых последовательных моделей (RNN).

Создание поисковой системы, которая понимает смысл запросов, а не только ключевые слова.

Используйте модель вложений (например, из Vertex AI) для преобразования текста в числовые векторы. Храните эти векторы и используйте поиск по сходству векторов для нахождения семантически связанного контента.

Почему: Вложения улавливают семантический смысл. Запросы могут находить концептуально похожие результаты, даже если они не содержат общих ключевых слов.

Творческому приложению требуются разнообразные результаты, в то время как фактический чат-бот нуждается в детерминированных ответах.

Увеличьте параметр `temperature` (например, >0.7) для творческих задач. Уменьшите `temperature` (например, <0.3) для фактических, согласованных ответов.

Почему: Temperature контролирует случайность вывода. Низкая температура выбирает наиболее вероятные слова; высокая температура увеличивает разнообразие.

Обработка большого документа, который превышает лимит токенов модели.

Разработайте решение, используя разбиение на части (chunking), суммаризацию или подход RAG для обработки документа по управляемым фрагментам, которые помещаются в контекстное окно.

Почему: Модели имеют конечное контекстное окно. Любой ввод, превышающий этот лимит, игнорируется, что приводит к потере информации. Архитектура должна учитывать это.

Домен 2: Разработка решений генеративного ИИ

Обнаружение, тестирование и развертывание различных базовых моделей в Google Cloud.

Используйте Vertex AI Model Garden в качестве центрального каталога для проприетарных моделей Google (Gemini), моделей с открытым исходным кодом (Llama, Mistral) и партнерских моделей.

Почему: Model Garden — это единая точка входа для доступа к отобранному набору базовых моделей, что упрощает обнаружение и развертывание в корпоративной среде.

Источник

Помощнику ИИ необходимо отвечать на вопросы о часто меняющейся информации, такой как запасы продуктов или последние новости.

Внедрите паттерн генерации с дополненным извлечением (RAG). Подключите LLM к внешней, актуальной базе знаний (например, базе данных, хранилищу документов).

Почему: RAG позволяет модели получать доступ к информации в реальном времени во время инференса, преодолевая ее ограничение по знаниям и предоставляя точные, актуальные ответы.

Создание корпоративной поисковой системы или разговорного ИИ-агента, основанного на данных компании.

Используйте Vertex AI Search and Conversation (часть Agent Builder). Укажите на свои источники данных (веб-сайты, документы), чтобы создать поисковое приложение или чат-бота.

Почему: Это управляемое решение с низким уровнем кода для создания обоснованных, корпоративных поисковых и чат-приложений, значительно снижающее сложность разработки.

Модели необходимо изучить узкоспециализированный навык, терминологию или последовательное поведение, чего нельзя достичь только промптингом.

Выполните управляемую тонкую настройку базовой модели, используя тщательно подобранный набор высококачественных примеров.

Почему: Тонкая настройка адаптирует внутренние веса модели, делая ее экспертом в определенной области. Это более мощный подход, чем промптинг, для глубокой специализации.

Необходимо настроить базовую модель для конкретной области, но не хватает ресурсов для полной тонкой настройки.

Используйте метод Parameter-Efficient Fine-Tuning (PEFT), такой как LoRA или адаптерная настройка, доступный в Vertex AI.

Почему: PEFT настраивает лишь небольшую часть параметров модели, достигая значительной кастомизации с существенно меньшими вычислительными затратами и временем.

Модель не справляется с задачами, требующими сложного, многоэтапного рассуждения (например, математические задачи, логические головоломки).

Используйте промптинг "цепочка рассуждений" (CoT). Проинструктируйте модель "думать шаг за шагом" перед тем, как дать окончательный ответ.

Почему: CoT побуждает модель разбивать проблему на части, что, как было показано, значительно улучшает ее способность к рассуждению и точность окончательного ответа в сложных задачах.

Модель должна последовательно генерировать вывод в определенном формате (например, JSON, определенный стиль письма).

Используйте few-shot prompting. Предоставьте 2-5 примеров желаемого шаблона ввода-вывода непосредственно в промпте.

Почему: Предоставление примеров более эффективно, чем просто описание формата. Модель изучает шаблон и применяет его к новому запросу.

Выбор правильного варианта модели Gemini для конкретного сценария использования.

Используйте Gemini Pro для сложного, высококачественного рассуждения. Используйте Gemini Flash для высокообъемных задач с низкой задержкой и чувствительностью к стоимости. Используйте Gemini Nano для приложений на устройствах.

Почему: Выбор правильного размера модели — это критически важный компромисс между возможностями, скоростью и стоимостью. Использование самой маленькой модели, которая удовлетворяет требованиям, является лучшей практикой.

Автоматизация извлечения структурированных данных (например, позиций, дат, итогов) из неструктурированных документов, таких как счета-фактуры или квитанции.

Используйте Google Cloud Document AI. Применяйте его предварительно обученные процессоры для распространенных типов документов или создайте пользовательский процессор для уникальных форматов.

Почему: Document AI — это специально разработанный сервис, который выходит за рамки простого OCR, чтобы понимать структуру и семантику документов, обеспечивая значительно более высокую точность для задач извлечения данных.

Источник

Применение возможностей генеративного ИИ (например, суммаризации, анализа настроений) к данным, хранящимся в хранилище данных BigQuery.

Используйте BigQuery ML для прямого вызова базовых моделей Vertex AI с помощью команд SQL. Обрабатывайте данные на месте, не перемещая их.

Почему: Это упрощает архитектуру, повышает безопасность за счет хранения данных в BigQuery и позволяет аналитикам данных использовать ИИ с помощью привычного синтаксиса SQL.

Повышение продуктивности бизнес-пользователей в их существующих инструментах, таких как Gmail, Docs и Sheets.

Интегрируйте Gemini для Google Workspace. Это обеспечивает помощь ИИ непосредственно в приложениях Workspace для таких задач, как составление электронных писем, суммирование документов и анализ данных.

Почему: Это приносит возможности ИИ пользователям в их привычном рабочем процессе, ускоряя внедрение и обеспечивая немедленные преимущества в производительности без переключения контекста.

Повышение скорости разработки и качества кода.

Предоставьте разработчикам Gemini Code Assist, который интегрируется в IDE для предложения автодополнения кода, генерации, объяснения и создания тестов.

Почему: Помощники по коду с ИИ сокращают время, затрачиваемое на шаблонный код, помогают понимать сложные кодовые базы и повышают общую производительность разработчиков.

Выбор подходящего инструмента для экспериментов и разработки в области генеративного ИИ.

Используйте Google AI Studio для быстрого, бесплатного веб-прототипирования с моделями Gemini через ключ API. Используйте Vertex AI Studio для корпоративной разработки с интеграцией GCP, средствами контроля безопасности и возможностями MLOps.

Почему: Google AI Studio предназначен для быстрого прототипирования; Vertex AI Studio — это путь к производству, предлагающий корпоративную безопасность, управление данными и масштабируемость.

ИИ-агенту необходимо принять определенную персону, следовать правилам и поддерживать последовательный тон во всех разговорах.

Определите поведение агента с помощью системного промпта. Эта инструкция предоставляется модели отдельно от пользовательского запроса, чтобы направлять ее общее поведение.

Почему: Системный промпт — это наиболее эффективный способ установить долговечные, последовательные поведенческие руководства без необходимости повторять их в каждом пользовательском промпте.

Решение требует общей, специфической возможности ИИ, такой как перевод, преобразование речи в текст или текста в речь.

Используйте предварительно обученные, специально разработанные API: Cloud Translation API, Speech-to-Text API или Text-to-Speech API.

Почему: Эти управляемые API высоко оптимизированы для своих конкретных задач и являются более экономичными и простыми в реализации, чем использование LLM общего назначения для той же функции.

Домен 3: Эксплуатация решений генеративного ИИ

Система ИИ используется для ответственного процесса, где ошибки дорогостоящи или опасны (например, медицинские сводки, финансовые отчеты).

Внедрите рабочий процесс Human-in-the-Loop (HITL). ИИ генерирует черновик, который затем просматривается, редактируется и утверждается экспертом-человеком.

Почему: HITL сочетает скорость ИИ с человеческим суждением и ответственностью, что крайне важно для снижения рисков в критически важных приложениях.

Производительность модели ИИ со временем ухудшается после развертывания в производство.

Внедрите непрерывный мониторинг для отслеживания производительности модели и обнаружения дрейфа данных или концептуального дрейфа.

Почему: Реальный мир меняется. Дрейф данных возникает, когда производственные данные больше не напоминают обучающие данные. Мониторинг критически важен для определения необходимости переобучения или обновления.

Прогнозирование и управление операционными расходами на сервис генеративного ИИ.

Помните, что сервисы Vertex AI GenAI тарифицируются по принципу "плати по мере использования", обычно за 1000 входных и выходных символов или токенов.

Почему: Стоимость напрямую зависит от использования. Архитекторы должны проектировать системы для управления длиной промптов и ответов, чтобы контролировать операционные расходы.

Приложение ИИ сталкивается с высокой задержкой или ошибками во время пикового пользовательского трафика.

Масштабируйте развертывание модели. Для конечных точек Vertex AI Prediction увеличьте количество реплик машин или используйте более производительные типы машин.

Почему: Производительность инференса не масштабируется бесконечно. Базовая инфраструктура должна быть подготовлена для обработки ожидаемого объема запросов.

Решение генеративного ИИ должно обрабатывать конфиденциальные данные, подпадающие под региональные нормы суверенитета данных (например, GDPR).

Настройте Vertex AI на использование региональных конечных точек. Интегрируйтесь с VPC Service Controls для создания сервисного периметра, предотвращающего эксфильтрацию данных.

Почему: Google Cloud предоставляет явные средства контроля для обеспечения обработки данных в определенном географическом регионе и их изоляции от публичных сетей, что является обязательным для многих режимов соответствия.

Приложение обрабатывает смешанные простые и сложные запросы, и использование одной большой модели слишком дорого.

Реализуйте маршрутизатор моделей. Предварительно классифицируйте входящие промпты и направляйте простые запросы к маленькой, быстрой и дешевой модели (например, Gemini Flash), а сложные запросы — к мощной модели (например, Gemini Pro).

Почему: Этот паттерн оптимизирует компромисс между стоимостью и производительностью, используя наиболее подходящий ресурс для каждой задачи, значительно снижая общие операционные расходы.

Домен 4: Ответственное проектирование и управление генеративным ИИ

Запуск новой инициативы генеративного ИИ в организации.

Начните с выявления высокоценной бизнес-проблемы или сценария использования. Не начинайте с технологии и поиска проблемы.

Почему: Успешные проекты ИИ — это те, которые приносят измеримую бизнес-ценность. Четкое описание проблемы обеспечивает целенаправленность и согласовывает проект со стратегическими целями.

Модель ИИ проявляет предвзятое поведение по отношению к определенным демографическим группам.

Устраняйте предвзятость на протяжении всего жизненного цикла ML: проверяйте и курируйте обучающие данные на предмет справедливости, тестируйте модель на предмет различных воздействий и внедряйте пост-развертывательный мониторинг на предмет предвзятых результатов.

Почему: Предвзятость в основном исходит из данных. Ее нельзя исправить одним техническим решением; она требует комплексного, непрерывного процесса тестирования и смягчения.

Предприятию необходимо ответственно масштабировать использование ИИ в нескольких отделах.

Создайте кросс-функциональный комитет по управлению ИИ. Разработайте четкие политики для разработки ИИ, оценки рисков, этического обзора, развертывания и мониторинга.

Почему: Централизованное управление обеспечивает согласованность, управляет рисками и способствует ответственному использованию ИИ, предотвращая хаотичное "дикий запад" неуправляемых проектов ИИ.

Предотвращение генерации вредоносного, ненавистнического или неуместного контента публичным чат-ботом.

Включите встроенные фильтры безопасности в Vertex AI. Настройте пороговые значения для таких категорий, как разжигание ненависти, домогательства и опасный контент.

Почему: Эти предварительно обученные модели классификации обеспечивают критически важную первую линию защиты от генерации небезопасного контента, составляя основную часть ответственного развертывания ИИ.

Обоснование инвестиций в ИИ перед высшим руководством.

Измеряйте ROI комплексно. Отслеживайте показатели эффективности (например, сэкономленное время, снижение затрат) и показатели результативности (например, увеличение выручки, улучшение качества, удовлетворенность клиентов).

Почему: Комплексный анализ ROI выходит за рамки простой экономии затрат, чтобы охватить полную бизнес-ценность, включая улучшения качества и новые возможности для получения дохода.

Развертывание системы ИИ в регулируемой отрасли (например, финансы, здравоохранение), которая требует прозрачности принятия решений.

Для традиционного ML используйте Vertex AI Explainability. Для GenAI используйте RAG с атрибуцией источника для предоставления ссылок и обоснований для сгенерированных ответов.

Почему: Прозрачность укрепляет доверие и является юридическим требованием во многих областях. Предоставление ссылок для ответов GenAI является основным методом объяснимости.

Разработка корпоративной стратегии по защите систем ИИ от новых типов угроз.

Примите принципы Secure AI Framework (SAIF) от Google, который предоставляет рекомендации по обеспечению безопасности цепочки поставок ИИ, модели и развертывания.

Почему: SAIF предлагает структурированное, концептуальное руководство по расширению традиционных практик кибербезопасности на уникальные вызовы ИИ, такие как инъекции промптов и отравление данных.

Источник

Внедрение нового инструмента ИИ для сотрудников для обеспечения успешного принятия.

Внедрите структурированную программу управления изменениями. Обеспечьте спонсорскую поддержку руководства, четко сообщайте о роли ИИ, предоставьте комплексное обучение и постепенно интегрируйте ИИ в существующие рабочие процессы.

Почему: Технология — это лишь часть решения. Успешное внедрение ИИ зависит от людей и процессов, требуя целенаправленных усилий для формирования навыков, доверия и новых способов работы.

Использование клиентских данных для обучения или запуска модели генеративного ИИ.

Обеспечьте строгое соответствие правилам конфиденциальности данных (например, GDPR). Используйте принципы минимизации данных, анонимизируйте PII, где это возможно, и внимательно изучите политику использования данных поставщика ИИ.

Почему: Использование клиентских данных с ИИ создает значительные риски конфиденциальности и соответствия требованиям. Управление данными и конфиденциальность должны быть основными соображениями при проектировании с самого начала.

Справочник

Google Cloud Generative AI Leader

Последняя проверка: май 2026 г.

Домен 1: Основы генеративного ИИ

Различение типов ИИ для конкретного бизнес-сценария.

Принятие решения о создании модели с нуля или использовании предварительно обученной.

Решение должно понимать и обрабатывать комбинации текста, изображений, аудио или видео.

Большая языковая модель (LLM) уверенно генерирует правдоподобную, но фактически неверную информацию.

Понимание основной технологии, которая позволяет современным LLM понимать контекст.

Создание поисковой системы, которая понимает смысл запросов, а не только ключевые слова.

Обработка большого документа, который превышает лимит токенов модели.

Домен 2: Разработка решений генеративного ИИ

Обнаружение, тестирование и развертывание различных базовых моделей в Google Cloud.

Источник

Создание корпоративной поисковой системы или разговорного ИИ-агента, основанного на данных компании.

Используйте метод Parameter-Efficient Fine-Tuning (PEFT), такой как LoRA или адаптерная настройка, доступный в Vertex AI.

Используйте few-shot prompting. Предоставьте 2-5 примеров желаемого шаблона ввода-вывода непосредственно в промпте.

Выбор правильного варианта модели Gemini для конкретного сценария использования.

Источник

Повышение продуктивности бизнес-пользователей в их существующих инструментах, таких как Gmail, Docs и Sheets.

Повышение скорости разработки и качества кода.

Выбор подходящего инструмента для экспериментов и разработки в области генеративного ИИ.

Используйте предварительно обученные, специально разработанные API: Cloud Translation API, Speech-to-Text API или Text-to-Speech API.

Домен 3: Эксплуатация решений генеративного ИИ

Производительность модели ИИ со временем ухудшается после развертывания в производство.

Прогнозирование и управление операционными расходами на сервис генеративного ИИ.

Приложение ИИ сталкивается с высокой задержкой или ошибками во время пикового пользовательского трафика.

Домен 4: Ответственное проектирование и управление генеративным ИИ

Запуск новой инициативы генеративного ИИ в организации.

Модель ИИ проявляет предвзятое поведение по отношению к определенным демографическим группам.

Предприятию необходимо ответственно масштабировать использование ИИ в нескольких отделах.

Предотвращение генерации вредоносного, ненавистнического или неуместного контента публичным чат-ботом.

Обоснование инвестиций в ИИ перед высшим руководством.

Разработка корпоративной стратегии по защите систем ИИ от новых типов угроз.

Источник

Внедрение нового инструмента ИИ для сотрудников для обеспечения успешного принятия.

Использование клиентских данных для обучения или запуска модели генеративного ИИ.