加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_阳江站长网 (https://www.0662zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 产品 > 正文

云数据中心4类机架/机柜设计的特征与进展

发布时间:2019-06-25 20:41:37 所属栏目:产品 来源:中国IDC圈
导读:2019年6月25日,由浪潮与OCP开放计算社区联合主办的首届OCPChina Day(开放计算中国日)在北京正式开启。本届OCP China Day聚焦人工智能、边缘计算、OpenRack、OpenRMC、SONiC、OAM等前沿技术话题,来自Facebook、LinkedIn、Intel、微软、百度、腾讯、阿里

2014年发布了天蝎2.0,在Scorpio2.0可以达到大规模交付的状态了,基于这个标准开发了冷存储服务器,单U 18个盘,还有高温耐腐蚀的服务器,针对中国的环境做的相关设计,我们也发布了X-Man,百度AI计算机,也是当时业界最领先的产品。之后发布了天蝎2.5,在这之上也做了产品迭代,X-Man2.0发布了,然后在2018年底发布了X-Man3.0,实现16个AI加速器高速互联,我们现在已经进入了X-Man3.0的阶段。

在AI、5G、边缘计算以及云计算技术浪潮下,我们面临新的挑战和机遇,我们需要更大的性能,面临更大规模供电挑战,我们需要支持单节点或者跨节点互联,我们有很多新的AI节点出来,需要标准化通用化,稍后我也会分享在这个方面做的工作。5G和边缘计算有从云端到算力的部署,有AI的能力,能更好地做边缘的语音图像相关的识别,更好地降低成本,云计算这一块需要有快速交付部署能力,同时以客户需求为先,快速达到交互的方案。

1.0是模块化,将供电散热集中管理分离出来,有比较好的模块基础。2.0主要做的标准化,1.0产品里不同系统厂商方案在一个Rack里无法共存,这给升级迭代带来很多问题,所以2.0做了很多标准化,把硬件软件做得很清楚,不管是中间件、还是散热还是服务器,都可以在Rack里共享。

在3.0,面对5G、边缘计算、AI新的场景里以及云计算的趋势做了一定的改进,我们肯定更关注弹性、可扩展性,减少相关部件,支持更大的供电能力,这是更高功耗相关的CPU和AI芯片,我们也需要更好的灵活部署方式。

这是3.0 Rack大的架构,我们以SU为单元构建这个系统,SU和OCP的OU有一点小的差别,稍微矮一点,这个我们的需求都能够满足,同时在Rack层面部署更多的节点,所以有比较多的好处,3.0同时可以兼容19英寸和21英寸的产品,达到降低整个系统的成本。

供电方面相比以前有很大的变化,我们设计了48V的PSU,也有AI的场景,包括在多个CPU里单个节点,怎么去支持整个部署能力,降低成本,48V是AI关键的基础。

散热方面,我们之前是整机柜集中式的散热,它的好处是比较灵活,而云计算面临变迁和混合部署也带来了新的问题,所以我们在新的层面上解决问题,同时采用液冷散热技术。我们在2017年就部署了液冷技术,再逐步推广到通用的CPU计算场景里。

这是我们几个典型的计算机配置,左边是微服务器低功耗产品,右边是高密度低成本的产品。第三,全宽主板,主要面向计算密集型产品,以及高性能存储场景。

最后面是第三个1U主板,在系统层面通过2U构建模块,支持大容量高计算场景的需求。所以刚才讲的是整个天蝎项目,也发展了很久,在中国也部署了几万个Rack,达到近百万服务器的规模,在新的AI、5G场景里,在液冷和48V供电场景里也做了新的尝试,我们也希望在这方面和OCP共同推动技术标准,应对新的挑战。

 

Steve Mills, Facebook Technical Lead:Facebook看到了在共同平台上构建基础架构的价值,我们可以在这个平台上分享新技术的开发

 

4

Steve Mills, Facebook Technical Lead

Bill Carter:谢谢Richard,过去八年里我们确实是从当时的标准慢慢向现在演化,当时我们是12V的标准,现在八年过去了我们变成了48V的标准,所以再次感谢丁先生跟我们分享天蝎这个项目。下面我们要有请来自Facebook的Steve Mills跟大家分享,SteveMills在这个项目里已经工作了四五年的时间,在我们这个行业已经是很长时间了,它主要是在OCP的RACK,还有供电的项目有很多经验。

Steve Mills, Facebook Technical Lead:大家好,大家知道OpenRackV3是下一代的解决方案,从今年的早些时间开始的,今天我要跟大家分享我们Open Power这个项目怎么通过OCP社区进行协作。我希望跟大家介绍一下什么是OpenRack V3,我们怎么在OCP的社区进行合作,接下来这个项目会有什么进展,首先谈一下为什么是Open Rack V3。

过去一段时间我们很迅速的扩展了我们拥有的很多技术的能力,因为技术发展非常快,这个会议室里几乎每个人都遇到了物理学基本限制相关的障碍,这些是原子级别的问题,是大家都还没有特别熟悉的领域,探索的成本越来越高。很多组件的制造商可以进行改进,但是需要很多研发支出才能实现这些收益。与这些相应的研发支出和相应的后续步骤怎么更好的控制成本和风险呢,最好的办法就是我们进行分享,这就是像OCP这样的平台的用武之地,Facebook看到了在共同平台上构建基础架构的价值,我们可以在这个平台上分享新技术的开发,FacebookV1和V2平台一开始是Facebook内部开发的,后来在后期的研发阶段进行开放研发。在这个架构里面,因为V1和V2是内部研发的,所以非常专注于Facebook自己的需求,后来我们有OpenRack V3之后它就有更开放的社区,所以越来越多的人就可以用这个平台给自己打造适合自己的功能,我们可以在一个通用的框架下增加更多的功能,所以我们需要的这样的平台需要有一定的灵活度,这样我们的用户才能把这些功能做定制化的开发。

我们在V3里面的power架构能够有更多的灵活定制,不是仅关注Facebook的需求。我们在一些比较先进的冷却高效机制里也有相关技术的发展,希望通过Open Rack V3为更多OpenRack架构做出贡献。这就是我对OpenRack V3的介绍,Open Rack V3现在又有什么新进展呢?首先就是我刚才说的Open Rack V3不仅仅是针对Facebook的需求,而是能够为更开放的社区提供更好的功能,我们在垂直间隔里跟V2有一些变化,V2是open U14、18毫米的间隔,V3是44.45毫米的间隔,微软、百度也有相应的需求,我们现在没有支持到EIA的宽度,只是垂直间隔这块。

第二是我们的动态定制,从V21400kg到V3的1600kg,第三是高度从41个openU到44×48mmopenU或48×44.45,另外是Cabal(音)Manager,我们把它当做一个可选的工具包,通过这个可选的工具包大家可以更好的给自己做定制的开发。下面就是液体的起管,这个液体管汇Liquid Manifold (ACS)就是我刚才说的先进的冷却机制,它也放在我们的可选工具包里的功能。另外是后端数据结构,也是放在这个可选工具包里面,它也是热插拔的。它有几种可以选的方案,比如高速的铜线、高速的光纤或者低速的铜线管理主线,这个也有一些方向可以走。我们在侧边板这块,Facebook V2这块只能有空气的containment,现在到V3会有更多的安全的设置放到里面,可以选择更多安全和其他的设置。对于我们的安全而言我们增加了更多的规格,整个项目正在进展过程中。下面看一下总线的电压的值,现在不仅有12V,也有48V,这两个都是可选的。电源架既可以是之前固定的,现在在总线任何的地方都可以进行部署,它可以在不同的电源架上进行安置。

(编辑:应用网_阳江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!