腾讯周小军:十个人管理1万多台 NoSQL 存储服务器的秘密
副标题[/!--empirenews.page--]
《腾讯周小军:十个人管理1万多台 NoSQL 存储服务器的秘密》要点:
主题简介腾讯目前有三大NoSQL分布式存储系统,分别是:
我们是SNG(腾讯社交网络事业部)社交网络运营部平台技术运营中心下的数据运维团队.团队主要负责CKV和Grocery二大NoSQL分布式存储集群的运营.目前团队有十几名工程师,负责一万几千台存储服务器.主要部署在深圳、天津、上海和广州等大区域. 存储服务器划分为几十个SET(仓库)集群,共有几百TB的内存和SSD存储容量,服务于QQ、朋友网、QQ空间、相册、广点通、微云、音乐等各类互联网核心业务. 部署模式NoSQL集群按SET的方式部署,SET也称之为“仓库”.一个SET是一个物理单元.仓库内至少拥有四种服务器角色:
每个SET可部署为跨机架、跨IDC、跨城容灾.一个SET就是一个永不停服、永不丢数据的独立的,标准化的服务单元,类似于标准化集装箱.我们最大的SET机器部署数量不会超过上千台,超大的SET会加大管理成本. 在腾讯的海量服务运营模型中,SET是一个非常重要的概念.接入层、逻辑层和数据层均按SET单元化来部署.一个业务譬如QQ音乐可能接入层和逻辑层各有十几个SET,数据层有几个SET.SET分别部署到不同的区域.每个SET都能容纳一定数量的在线用户(譬如500万在线用户).
这应该是中国互联网史上最大规模的一次调度.调度的成功受益于SET化的管理,受益于数据SET的三地同步. 同步是怎么做的呢?业务数据按仓库为单元,在全国各地IDC部署几个异地仓库,通过数据流水来实现各异地仓库间数据同步和一致性保证.当某一城市的IDC灾难性故障时,业务能迅速切到其他城市IDC恢复数据的读写,实现业务柔性可用,保证业务服务的持续性.数据的同步由同步中心负责,业务写入同步中心,由各地的仓库同步服务,从同步中心中读取数据,并写入本地仓库. 技术特点
高可用架构经过几年的不断打磨及优化,我们NoSQL分布式集群的架构已经非常的成熟,主要有以下几个特点:
数据即服务的运营理念数据中心由计算、存储、传输三大要素构成,IaaS服务提出了把传统数据中心的CPU,内存,网络和存储等转变为资源的目标,为业务提供计算资源的池化及智能调度管理.对于数据层我们的目标则是DaaS,把数据做为服务提供给用户. 构建可伸缩的分布式数据库我们的分布式数据库把存储资源池化,把内存存储块及磁盘存储块做为资源,放在一个存储大池子里按照较固定的存储单元进行管理,并在其之上部署存储智能调度系统. 因此,我们的上万台存储服务器已经是真正意义上,具备动态伸缩能力的分布式数据库:
我们的数据管理集中化,在数据复杂度以及数据量不断增长的情况下,数据运维能够支撑多变的业务需求. 运维即服务,数据即服务在DaaS中,我们已经落地实施了以下几点:
成本优化策略(编辑:应用网_阳江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |