加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_阳江站长网 (https://www.0662zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 服务器 > 安全 > 正文

盖国强:《炉石传说》大故障,不要以为你也可以幸免

发布时间:2021-01-07 18:30:50 所属栏目:安全 来源:网络整理
导读:副标题#e# 《盖国强:《炉石传说》大故障,不要以为你也可以幸免》要点: 本文介绍了盖国强:《炉石传说》大故障,不要以为你也可以幸免,希望对您有用。如果有疑问,可以联系我们。 作者简介 盖国强 中国地区首位Oracle ACE和ACE总监,中国地区最著名的Orac

如果大家还记得我曾经写下的DBA守则,没有备份对于DBA来说将会是致命的,而如果没有有效备份,那么备份也只能是心灵安慰.不论如何,备份至少可以给我们重来一次的机会,暴雪这一次最终救命的就是备份.虽然是回退到了14日.

既然备份这么重要,国内数据库的备份情况如何呢?云和恩墨白求恩平台最近发布的《中国2016年Oracle数据库运行现状报告》显示,有完整RMAN备份的数据库不到20%,24%的数据库甚至处于非归档模式下.

下图来自报告数据,可以看到其实国内的数据库的DG的使用率其实并不高,仅有21%:

Bethune 平台可以帮助大家检查RMAN备份完整性,Dataguard同步及时性,假期来临之前强烈推荐大家为数据库做一次健康检查.

关键节点是什么?

回顾一下,数据库带病坚持工作,这是整个案例最核心的一个决策,也就是说,通过在线运行,同时修复问题(坏块),向前走.

这也是一个艰难的决策,如此可以减少业务的中断,但是面临的风险就是可能最终数据不一致,需要回退或者承受复杂的校验工作.

大家可以想想我们面临这样的工作会如何处置?

我就此访问了浙江移动王晓征王总,他表达了他的观点:

我觉得得按照业务特性,事先约定优先保A(可用性)还是保C(一致性),如果没约定的话,如果我指挥,我会临机进行决断.

我非常赞同这一观点,有了事先约定,应急处置时才能有准则,不出现重大偏颇.

要一致性还是连续性?

如前所述,每一个DBA团队都应该有一个准绳,那就是在关键时刻,要保障一致性(准确性)还是连续性?

对于金融机构,毫无疑问,要保证数据库的一致性,在遇到故障时,可以果断中断业务提供,进行数据恢复或者修复;

而对于互联网业务等,可能连续性就更为重要,类似携程的业务,中断几天的服务是不可想象的;王晓征就此总结说:

在运营商系统建设的过程中,最初觉得业务连续性最为重要,但是当这些问题已经被较好的解决之后,现在觉得数据的一致性变得更重要起来,所以不同系统在不同阶段,就会有不同的取舍.

这是一个辩证的思考,也是运维发展到一定高度之后才能有的判断.

为何不切灾备?

关于这样严重的事故,为何不切灾备?

如前所述,从备份数据库的一字之别,我猜测这个系统根本就没有灾备,所以无从切换,毕竟这只是一款免费的游戏,在官网首页的显示『《炉石传说》官方网站_暴雪首款免费休闲卡牌网游』.

对于灾备的部署和切换,王晓征表示浙江移动内部是这样的:

(编辑:应用网_阳江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!