site stats
据说是阿里云史诗级故障内部复盘分析,如果是真的,那说明了几个问题:基础组件很可能有循环依赖,一次大挂难以快速拉起。白名单结果没有校验,异常没有告警,发布没有灰度,挂了没法回滚。D+11分钟发现问题,D+22分定位到根因,D+28分钟后才开始执行修复,这个故障响应速度确实是实打实的草台班子了。
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多