跳至内容
SRE Knowledge Vault

SRE Knowledge Vault

构建高可用架构,沉淀自动化运维最佳实践。

  • Self Technical Vault
  • 排错日常更新!!

快速导航

请直接选择你需要查阅的模块:


架构原则

始终坚守以下 SRE 核心原则:

  • IaC (基础设施即代码): 拒绝手动操作,凡是能用 Terraform 或 Ansible 描述的,绝不妥协于控制台点击。

  • Observability (可观测性): 监控先行。没有指标度量的系统,就像蒙眼狂奔的汽车。

  • Design for Failure (面向失败设计): 永远假设任何云组件都会在下一秒宕机,通过冗余和容灾保证系统韧性。

“SRE is what happens when you ask a software engineer to design an operations team.” — Benjamin Treynor Sloss, Google