加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_阳江站长网 (https://www.0662zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 产品 > 正文

腾讯运营经理王鹏:互联网数据中心通用验证测试技术规范

发布时间:2020-09-16 20:29:36 所属栏目:产品 来源:站长网
导读:中国IDC圈讯,开放数据中心峰会(ODCC2020)在北京召开,峰会围绕数据中心新基建为主题,有数据中心领域及相关行业的众多专家与会。在9月16日新技术与测试分论坛上,腾讯数据中心经理王鹏带来了题为互联网数据中心通用验证测试技术规范的演讲。 王鹏 各位

中国IDC圈讯,开放数据中心峰会(ODCC2020)在北京召开,峰会围绕数据中心新基建为主题,有数据中心领域及相关行业的众多专家与会。在9月16日新技术与测试分论坛上,腾讯数据中心经理王鹏带来了题为“互联网数据中心通用验证测试技术规范”的演讲。

王鹏

王鹏

各位嘉宾大家下午好,我是来自腾讯数据中心的王鹏,首先做一个简单的自我介绍。目前我主要负责西南片区的数据中心运营管理工作,同时也深度参与重庆自建数据中心和贵阳山洞数据中心的设计、建设和测试工作,在内部我也同步在推动部门内的数据中心运营技术创新工作,在对外这一块目前是在着力推动验证测试、逻辑设计、基础设施维护的标准化工作。

回到今天分享的主题,今年我们在ODCC成立了一个项目组,主要编写《互联网数据中心通用验证测试技术规范》,验证测试这个概念最早从2008年、2009年从国外引入中国,国外的IT巨头首先提出验证测试概念。经过这些年数据中心整个行业的快速发展,验证测试已经在行业内成为大家的共识,也成为数据中心整个生命周期当中不可或缺的一个部分。

大家可以看一下右侧的图,这是反映数据中心运营生命周期和故障率的典型的曲线,这个曲线的起点就是验证测试结束交付给运营,在运营的初期和中期、末期,故障率是不同的,在初期和末期故障率明显较高,而在开展验证测试的项目当中,它在初期和末期相较于没有开展过验证测试的项目来讲,整体故障率明显降低。

这就是我们要去做基础设施验证测试的目的所在,它的意义在于通过验证测试能够帮助客户验证,主要的基础设施在生产、安装、运行、维护过程当中是否满足了用户的设计要求和使用要求。目前国内通用的验证测试方法,就是通过多种假负载搭配来模拟数据中心未来运行的环境,全面分析、掌握基础设施运行的功能和性能参数。

我们大概做过一个统计分析,验证测试占整个数据中心基础设施建设成本的1%左右,通过1%的成本支出能够创造很大的价值,帮助数据中心客户在数据中心正式交付前给数据中心做一次全面而深度的体检,帮助客户检验数据中心的可用性,降低初始的故障率,识别运行的风险,同时也降低运维人员在运维过程中的难度,提高整体项目的交付质量和交付效率。

我们看一下整个行业目前的现状。

近几年数据中心整个行业内建设项目发展非常迅猛,有数据分析,在过去3年当中整个行业平均增速超过30%。另一方面我们也看到,目前在行业内没有权威的验证测试技术规范,而且对于很多的中小数据中心客户而言,他们测试经验的不足,导致很多可能后续会影响到运营安全的测试细节被忽略掉。而且目前整个行业内主要是从设计角度去指导测试工作,缺乏长期运营使用的角度去把握测试过程,整个导致我们目前行业内在验证测试这一块的效果不够理想。

我们在ODCC成立这个项目的目标就是通过编写这样一份规范、细化相关的内容,在数据中心建设和交付期间,去规范它的厂验测试、厂家自测、现场预检查、单设备测试、单系统测试、综合系统测试、环境测试等内容,并提供相应的评判标准,确保整体测试效果达标。整个规范覆盖了数据中心的电气、暖通、智能化设备、消防系统及运行环境等。

数据中心编写规范的经验和技术离不开我们整体技术的发展,腾讯数据中心在过去20年当中经历了四代数据中心的发展过程,在第一代数据中心中,主要是以传统的风冷模式加部件级冗余,当时整个国内还没有开展验证测试。

第二代数据中心,我们对整体架构进行冗余设计,并且在腾讯的天津自建数据中心首次引入了验证测试的概念,但是在当时的情况来看,整个验证测试的费用是非常高昂的,而且主要是由国外的公司来做主导。

在第三代数据中心中,我们为了适应互联网企业在整个行业内的快速爆发式的增长,我们探索了以微模块+冷水系统为主的模块化数据中心,同时我们也在同步去探索适合于国内互联网行业的测试方法论。

第四代数据中心,腾讯将基础设施产品化,以方仓的形式来构建T-block数据中心。大家请看最右侧的图,我们将传统意义上的空调、配电设备,这些原本要跟房间、跟基建相结合起来的设施,我们将它产品化、方仓化,放在集装箱,在工程实现预制化产品,到现场快速安装,既确保产品出厂质量,要提升了整个项目的建设交付效率。在这个阶段,我们同步完整构建了自身的验证测试标准。

目前经过多次的编写和讨论工作,目前我们整个验证测试规范主要分成以下七个环节:

L0:厂验测试。

L1:厂家自测。

L2:预检查。

L3:单设备测试。

L4:单系统测试。

L5:综合系统测试

L6:环境测试。

首先介绍第一个部分L0厂验测试。厂验测试是由甲方、建设单位、设备厂商共同在工厂或者是权威的第三方实验室里对设备的生产工艺、设备的出厂检验的流程进行检查,并对现场不具备测试条件,需要到实验室去做测试项目进行产品测试。从而确保现场安装的设备设施、产品的质量,符合当时招投标的要求。

这里举一个简单的例子,BA系统对于数据中心从业者来说一定不陌生,BA系统是控制数据中心整个水冷系统运行的一个“大脑”,它控制包括冷机、冷塔、阀门、水泵设备的正常运行和逻辑切换,在常规的BA系统测试当中需要整个暖通工程建设完成之后才能够开展BA测试,而且由于BA系统整体逻辑程序非常复杂,它的整个调试耗时非常长,这就导致很多项目即使是在交付之后,BA系统仍处于调试的状态,而且在运营初期会埋下很大的隐患。

在本次规范当中我们结合腾讯目前在用的创新式的BA的厂验测试标准,将BA的测试工作提前到厂验环节进行,通过在现场去搭建这样一套BA的厂验平台。大家看下右下角的这张图,这张图上绿色图形,代表水冷系统的运行设备,比如冷机、水泵,红色数值反映了这些设备的工作状态,我们通过搭建BA厂验平台,实现了对BA逻辑程序的提前调试,使得建设和测试工作能够同步开展,最终达到的效果就是整体项目缩短交付时间可以缩短20天到30天左右,而且能够确保在项目正式交付的同时,BA系统即能够马上投入正常运行。

在完成厂验测试的基础上,来到L1厂家自测环节,厂家在完成现场施工及设备安装之后,需要对相关的工艺、设备的功能进行充分的调适,并提供相关的厂家自测报告。

在L2现场预检查环节,由专业的第三方测试单位进驻到现场,对现场的设施运行环境、安装工艺进行复核,确保在正式开展第三方测试前,现场设备的功能、运行情况达标。

(编辑:应用网_阳江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!