Site Reliability Engineering

Awesome Site Reliability Engineering Awesome

一个很棒的精选清单 Site ReliabilityProduction 工程资源.

What is Site Reliability Engineering?

> “从根本上说,这就是当您要求软件工程师设计操作功能时会发生的情况.” - Ben Treynor Sloss,谷歌工程副总裁,谷歌 SRE 创始人

Contributing

请看一下 contribution guidelines 第一的. 总是欢迎贡献!

Culture

Education

Books

Hiring

Reliability

Monitoring & Observability & Alerting

On-Call

Post-Mortem

Capacity Planning

Service Level Agreement

Performance

Programming

Misc Articles

Real-time Messaging

Blogs

Newsletters

  • DevOpsLinks - 关于 SRE、SysAdmin 和 DevOps 新闻、工具、教程和意见的每周时事通讯.
  • KubeWeekly - 有关 Kubernetes 的所有内容的每周时事通讯. KubeWeekly 由 Bob Killen、Chris Short、Craig Box、Kim McMahon 和 Michael Hausenblas 策划
  • SRE Weekly - 每周网站可靠性通讯.
  • O’Reilly Systems Engineering and Operations Newsletter - 每周系统工程和运营新闻以及业内人士的见解.
  • ChaosEngineering.news - 混沌工程通讯. 混沌工程的所有内容,直接发送到您的收件箱!

Conferences & Meetups

Twitter

SRE Tools