GCP 云 DevOps 工程师 (PCDOE):考试内容究竟是什么
PCDOE 考察 GCP 上的 SRE 和 DevOps 实践——Cloud Build、Cloud Deploy、GKE 管道、SLO 设计、事件响应。以下是考试内容以及它与 AZ-400 和 DOP-C02 的比较。
PCDOE — Professional Cloud DevOps Engineer(专业云 DevOps 工程师)— 是 Google 以 SRE 为特色设计的 DevOps 认证。费用 200 美元,考试时长两小时,大约 50 道题,有效期两年。如果你考过任何 Google Professional 级别的考试,这都是标准模式。不标准的地方在于案例研究的密集程度。PCDOE 以其是 Google 专业考试中首次尝试通过难度较高的考试之一而闻名,原因几乎完全在于题目很长,情景复杂,并假设你实际在生产环境中运行过服务。
通过率并未公布——Google 也不公布具体分数,只显示通过/未通过——但根据学习小组讨论中的传闻,首次尝试通过率明显低于 ACE,略低于 PCA。对此要持保留态度,自报通过率往往偏向于那些未通过但想发泄的人。
考试实际涵盖的内容
官方指南将 PCDOE 分为五个领域。权重每隔几年会重新调整,但整体结构保持一致:
- 应用站点可靠性工程(SRE)原则。 SLO 和 SLI 设计、错误预算、减少重复性劳动、无指责事后分析。直接取材于 Google 的 SRE 书籍——如果你还没读过,至少要阅读关于 SLO、告警和事件响应的章节。
- 构建和实施 CI/CD 管道。 Cloud Build、Artifact Registry、Cloud Deploy、用于本地到集群工作流的 Skaffold、与 GitHub / GitLab 集成。使用 Artifact Analysis 进行容器扫描。用于签名镜像的 Binary Authorization。
- 实施服务监控策略。 Cloud Monitoring、Cloud Logging、Cloud Trace、Cloud Profiler、Error Reporting。整个“Cloud Operations”套件(以前称为 Stackdriver——文档仍称“Cloud Ops”,但招聘人员和老工程师会交替使用这两个名称)。
- 优化服务性能。 GKE 工作负载调优、自动扩缩(HPA、VPA、集群自动扩缩器)、成本优化、容量规划。
- 管理服务事件。 轮班值守、事件指挥、运行手册、事后分析报告。是的,他们会问流程问题,而不仅仅是工具问题。
案例研究问题是难点。你会得到一个描述虚构公司的场景——包括其架构、当前痛点、团队结构——以及三到四个问题,要求你同时记住所有这些信息。粗略阅读是人们失败的原因。这些问题旨在让你在仔细重读场景后,发现看似明显的答案其实是错误的。
你真正需要了解的
并非所有 GCP 服务都会出现。以下是一个粗略的重点列表,根据主题在学习报告中出现的频率加权:
| 服务 / 主题 | 考试权重 |
|---|---|
| Cloud Build, Cloud Deploy, Artifact Registry | 高 |
| GKE 操作、自动扩缩、工作负载身份 | 高 |
| SLO / SLI / 错误预算计算 | 高 |
| Cloud Monitoring、告警策略、仪表盘 | 高 |
| Cloud Logging、基于日志的指标、日志路由 | 中 |
| Binary Authorization、容器扫描 | 中 |
| Cloud Trace、Profiler、Error Reporting | 中 |
| Terraform / Config Connector 基础 | 中 |
| Anthos / 多集群(比以前少) | 低 |
| Pub/Sub、用于异步模式的 Cloud Tasks | 低 |
你不需要记住每一个 Cloud Build YAML 键。你需要识别什么时候 Cloud Build 是正确答案,什么时候是 Cloud Deploy,或者什么时候是第三方 CI 加上 Cloud Deploy。考试喜欢“公司 X 正在使用 Y,他们接下来应该做什么”这种提问方式。
与 AZ-400 和 DOP-C02 的比较
这三个认证在概念层面涵盖了相似的内容——管道、监控、事件响应、IaC、安全——但侧重点不同。
| PCDOE | AZ-400 | DOP-C02 | |
|---|---|---|---|
| 费用 | $200 | $165 | $300 |
| 时长 | 约 2 小时,约 50 题 | 约 150 分钟,约 50 题 | 约 3 小时,约 75 题 |
| 有效期 | 2 年 | 1 年,免费续期 | 3 年 |
| SRE / SLO 深度 | 高 | 低 | 中 |
| 原生 CI/CD 重点 | Cloud Build / Deploy | Azure DevOps + GitHub | CodePipeline / CodeBuild |
| IaC 重点 | Terraform, Config Connector | Bicep, ARM, Terraform | CloudFormation, CDK |
| 最难的部分 | 案例研究密集度 | Azure DevOps 广度 | DOP-C02 冗长问题 |
PCDOE 最侧重于 SRE 概念——SLO、错误预算、重复性劳动——因为 Google 确实是这些词汇的创造者。AZ-400 侧重于 Azure DevOps(产品)和 GitHub Actions 集成。DOP-C02 涵盖的广度最大,但场景深度不如 PCDOE。
如果你在 GCP 工作,PCDOE 是显而易见的选择。如果你在 Azure 工作,选择 AZ-400。如果你在 AWS 工作,选择 DOP-C02。技能重叠度很高,一旦你忽略服务名称,管道看起来几乎相同。跨云进行 DevOps 认证选择很少是正确的做法——与你日常工作相符的认证才是你可以通过实际工作来学习和准备的认证。
适用人群
老实说,有三类人:
已经在 GCP 上工作的资深 SRE / DevOps 工程师。 这是考试为之设计的受众。如果你已经在 GKE 上值守服务至少一年,那么这些问题会感觉像是你团队中已有讨论的延伸。三到六周的集中准备通常就足够了。
从 AWS 或 Azure 转型的平台工程师。 SRE 概念可以一对一地迁移。但服务名称不同。预计需要 2-3 个月的学习时间,才能将你现有的知识映射到 Cloud Build、Cloud Deploy 和 Cloud Ops 套件上。构建一个小型项目,通过 Cloud Build 进行 CI,通过 Cloud Deploy 部署到 GKE,并将 SLO 发送到 Cloud Monitoring。这一个项目可能涵盖了考试的 40%。
寻求 DevOps 职位的职业转型者。 老实说,这是一个高难度目标。PCDOE 假设你经历过真实的生产事件。如果你没有,案例研究问题会显得陌生,这是再多的视频课程也无法弥补的。先考 CKA 或 KCNA,在一个平台角色工作一年,然后再回过头来考 PCDOE。
来自实践的学习心得
几件人们常遇到的困惑:
SRE 书籍是必读书,而非可选。 Google 的 《站点可靠性工程》 和 《站点可靠性工作簿》 都可在网上免费获取。SLO / 错误预算章节是直接的考点。跳过它们而依赖课程软件是许多聪明工程师在此考试中失败的最常见原因。
Cloud Deploy 较新,且权重过高。 它于 2022 年正式发布 (GA)。早期的学习指南对其覆盖不足。花一个周末时间完成官方的 Cloud Deploy 快速入门,包括两个环境和一个金丝雀发布——这直接对应多个考题。
了解 Cloud Build 私有池和默认池之间的区别。 当问题涉及 VPC 内部构建时,私有池通常是答案。通用的“我们想要更快的构建”问题通常与机器类型或工作池大小有关。
Binary Authorization 的出现频率超乎你的预期。 “我们需要在生产环境中强制使用签名镜像”的场景几乎肯定会以某种形式出现。
总结
如果你确实在 GCP 上从事 DevOps 工作,PCDOE 是一个扎实的专业认证。在类似市场中,其薪资范围与 PCA 大致相同——在美国主要大城市,资深 DevOps / SRE 职位的基本工资为 15 万至 20 万美元,而 FAANG 和广告技术公司的总薪酬一旦加上股权,可能超过 25 万美元。该认证本身并不是薪资倍增器;真正起作用的是底层的 SRE 经验。PCDOE 只是让招聘人员更容易理解这些经验。
如果你正在学习,可以在 CertLabPro 上浏览 PCDOE 题库或开始一场限时模拟考试。题库中的案例研究问题与真实考试形式最为接近——死记硬背的题库并不能让你为实际考试内容做好准备。
如果你正在考虑是否要考这个证书:你在工作中写过事后分析报告吗?如果是,这个证书对你来说会感觉很自然。如果不是,先经历一两次真实的事件,然后再来考虑。