研发管理-稳定性风险治理

前言:

在研发管理过程中,软件产品上线运行中,不可避免的会有很多故障问题,特别是新品上线。今年上线新品的时候,就出了很多故障,造成了很不好的影响,包括产品的和研发团队的和我个人的。

学习了devops的部分课程,其中,系统性的风险治理内容,影响深刻,很有启发,在这里总结和分享。

故障前:

**也就是开发,测试,实施等过程
高可用架构设计
故障恢复预案
混沌工程

故障中:

异常检测
故障定位
故障隔离
故障恢复

故障后:

故障复盘
COE分析
改进措施
问题管理

研发团队和研发管理人员,需要不断的促进业务发展和技术架构演讲,做到稳定的用户体验,避免重大故障,提升组织技术能力。

上面列的每一项,都需要深入学习研究落地。

Logo

权威|前沿|技术|干货|国内首个API全生命周期开发者社区

更多推荐