加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_阳江站长网 (https://www.0662zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 服务器 > 安全 > 正文

盖国强:《炉石传说》大故障,不要以为你也可以幸免

发布时间:2021-01-07 18:30:50 所属栏目:安全 来源:网络整理
导读:副标题#e# 《盖国强:《炉石传说》大故障,不要以为你也可以幸免》要点: 本文介绍了盖国强:《炉石传说》大故障,不要以为你也可以幸免,希望对您有用。如果有疑问,可以联系我们。 作者简介 盖国强 中国地区首位Oracle ACE和ACE总监,中国地区最著名的Orac

按业务重要度,实现不同保障级别.

  • 一般系统:只做数据备份,无高可用,无容灾;
  • 重要系统:数据备份,高可用,无容灾;
  • 核心系统:备份,高可用(部分含柔性可用),容灾.

在实操层面,一般系统基本绝迹,目前以核心和重要系统为主.

如果出现数据损坏,核心系统肯定切容灾了,这种情况如果是硬件损坏或者删除数据文件引起的问题,基本就搞定了;当然,最怕的就是误操作或代码bug搞出来的数据丢失,可能把容灾端数据同时破坏,那就只能通过备份来恢复啦.

由此可以看出,即便有了完备的灾备环境,也很难防范所有问题,尤其是人为的误操作,所谓『功夫再高,也怕菜刀』,一个误删除可能就级联到所有的系统,再加上软件BUG不可避免,除了灾备,必然还要有可靠的备份来托底.

运维团队怎么配置?

大家还要思考一个问题,在处理复杂故障的时候,工作不能中断,但是人不能持续运转,在暴雪的这次事故中,从14日至18日,将近5天的时间,处理人员可能已经更替了几轮,如何延续处理思路、执行正确决策、保持核心战斗力,这也是运维要思考的重要因素.

如何幸存于类似事故?

好吧,我们谈一谈如何避免陷入这样的困境?以下是我们的一些思路,与大家商榷.

首先,要有完善、有效的备份和容灾机制.诚然很多企业都有了一整套的备份、容灾机制,但是这套备份机制能否真实奏效是需要检验的.我接触过某大型企业,投入巨资兴建的灾备中心,从未正式切换过,这样的灾备在故障来临时也很难有人拍板去进行切换,所以备份的有效、容灾手段的有效是必须确保的.

注意:备份的恢复速度必须足够的考虑到,磁带的低效备份关键时刻会害死人.

其次,要有完善的故障处理策略和流程.对于不同系统,在关键时刻要优先确保什么,是要订立规则的,有了规则才能照章办事,不走错方向,不无辜背锅.几年前某国内金融系统出现数据坏块,同样选择了带病修复,最终没能解决问题,同样选择了回档承担了数据损失.

再次,要有端到端融会贯通的应急机制.也就是说不仅仅技术上具备容灾应急的响应方案,从业务端同样要有对应的预案,以便应急时同步处理,区别对待.很多时候,有了业务上的应急、降级服务方案,技术层面的处理就能够从容许多.

最后,要有能够快速协同的团队资源.很多时候严重的故障,需要较大规模的专业团队协作处理,原厂商和第三方在其中都承载着重要的角色,所以关键时刻,要能够获得内外部快速及时的支持,尤其是在绵延数天的高强度工作中.

对于事后的补偿,19日暴雪已经给出了反馈,第一条就是“只要曾经在2017年1月18日18点之前登录过国服玩家,均可获得与25卡牌包等值的补偿”,越来越觉得,这次“营销”是很成功的.

感谢王晓征提供观点,欢迎大家留言回复您的观点,以上内容纯属猜测!!

(编辑:应用网_阳江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!