集成AI加速 英特尔以数据为中心的创新产品组合提升产品领导力
此外,多路处理器非常关注平台的RAS,即可靠性、可用性以及可维护性。第三代至强可扩展处理器提供了非常丰富的RAS支持,可以很好地处理可能出现的内存错误、PCIe设备上的错误,或CPU内核本身出现的错误,并实现错误隔离、故障诊断。
在人工智能技术的支持上面,第一代至强可扩展处理器Sky Lake提供了AVX-512指令集,AVX-512指令集可以用FP32的数据格式进行深度学习计算。2019年发布的第二代至强可扩展处理器Cascade Lake提供了DL Boost技术,DL Boost包含VNNI矢量神经网络指令集,VNNI支持Int8数据格式,加速深度学习的推理应用。今年,第三代至强可扩展处理器的DL Boost深度学习加速技术进一步升级,VNNI指令集可以支持bfloat16的数据格式,这样在人工智能的训练和推理上面,都可以得到更好的性能提升。 bfloat16是一个精简的数据格式,与如今的32位浮点数(FP32)相比,bfloat16只通过一半的比特数且仅需对软件做出很小程度的修改,就可达到与FP32同等水平的模型精度。新增的bfloat16支持同时为CPU的AI训练和推理性能提供加速。在英特尔的工具集当中,像TensorFlow、Pytorch、MXNet都已经可以完美来支持bfloat16的AI训练。 简而言之,在云计算、数据分析及关键任务工作负载上,第三代至强可扩展处理器可以提供更多内核、更高频率,并支持更大内存。对于数据分析的应用,相对于上一代的平台性能可以提高98%。对于人工智能应用,借助升级后的DL Boost技术,搭配bfloat16的数据格式,在人工智能的训练性能上相比上一代可以提高93%,人工智能推理方面的性能可以提高90%。针对云计算的虚拟机密度场景下,第三代至强可扩展处理器支持的内核数可以最高到28个核,如果搭配一个8路平台,可以轻松支持224个物理核,实现非常高的密度,帮助用户优化TCO。 除了CPU,英特尔还提供了GPU、FPGA、专用AI芯片等丰富的硬件产品,并与业界生态伙伴一起开发软件解决方案,给客户一个非常完整的从芯片到方案的产品组合,满足他们对于人工智能和分析这些当今最热的应用和未来计算方向的需求。 英特尔傲腾持久内存进一步加速AI与数据分析面对大数据浪潮,数据价值的实现要经历数据生产、收集、提取和计算的过程。未来存储的发展将由工作负载的需求驱动,现代存储系统需要灵活多变,存储技术也正在不断演进以满足多样化需求。这也意味着我们需要让存储的性能变得更高,从而拉近更多数据与处理器之间的距离。 为此,英特尔推出傲腾持久内存全新技术,通过让更多的数据保留在内存中(作为内存的拓展或部分替换),从而更加靠近CPU,实现了更高的效率;同时,其以类似于双列直插式存储模块(DIMM)的形式,提供接近DRAM(动态随机存取存储器)的内存计算速度,且每GB价格低于DRAM,也大大减少了企业的成本开支,最终帮助企业在效率和成本之间实现了完美的平衡。 相较于在内存容量限制下不得不使用多台服务器Scale Out(横向扩展,靠添加设备提升服务能力),Scale Up(纵向扩展,提升单台设备的性能和服务能力)可以减少服务器的数量,减少关键部件的采购,以及更多服务器集群的管理开销,英特尔傲腾持久内存从CAPEX(前期购置成本)和OPEX(运营成本)两个方面降低总体拥有成本。 傲腾持久内存可以支持更大的数据库、更高可靠性和更快地系统恢复,为处理器性能过剩、内存容量不足的场景提供足够的内存,从而减少设备数量、软件授权费用、机柜数量和能源消耗等。通过持久内存来扩展现有内存容量,可以极大降低客户业务的总成本TCO(Total Cost of Ownership)。 英特尔傲腾持久内存不但具有大内存、低延迟、持久化、高性价比的特点,同时使用模式也比较多样化,提供了App Direct Mode(AD)和Memory Mode(MM)两大类模式,由此也可以支撑更多的环境和场景化应用。 英特尔技术专家表示,英特尔把傲腾技术引入到持久内存为内存的层级带来了很大的技术革新。英特尔傲腾持久内存在内存和SSD之间新增了一个存储层级,具备像内存一样的超低访问延迟,超高寿命与可靠性,同时还具备持久化存储和按字节访问的能力。在AD模式下,特定的应用程序可直接访问由英特尔傲腾持久内存带来的独立持久内存资源。 英特尔傲腾持久内存不仅可以改善系统的TCO,还可以消除I/O瓶颈,提升性能,进而驱动产生新的内存和存储的融合类应用,如超融合基础架构、数据库、人工智能或者大数据分析。这些都是英特尔傲腾持久内存能够展现技术优势的地方。 作为第三代至强可扩展平台的一部分,英特尔同时发布了英特尔傲腾持久内存200系列,为客户提供每路最高达4.5TB的容量,以进行内存数据库、密集虚拟化、分析及高性能计算等数据密集型工作负载的管理。傲腾持久内存200系列提供的CPU对持久性数据的访问速度比主流NAND SSD读取数据快200倍以上。与第一代产品相比,英特尔傲腾持久内存200系列的平均内存带宽增加了25%。 上一代傲腾持久内存配合第二代至强可扩展处理器,单路最高能放6条512GB持久内存,最大3TB持久内存。200系列能在单路第三代至强可扩展处理器上提供最高4.5TB内存,包括3TB的傲腾持久内存和普通的DRAM内存,单条可用容量没变,有128GB,256GB和512GB三个型号,支持与普通DRAM公用内存插槽,支持两种内存的混插。 集成AI加速推动产业智能化变革(编辑:应用网_阳江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |