加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_阳江站长网 (https://www.0662zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 政策 > 正文

AMD RX 6000架构揭秘:性能提升多达54%

发布时间:2020-11-19 14:07:01 所属栏目:政策 来源:互联网
导读:访问: 阿里云双11全球狂欢季返场继续 双核8G云服务器首年286.44元 而在7nm工艺不变、核心规模翻番、频率大幅提升的同时,整卡功耗依然保持在最多300W。 本文中,我们重点讲讲RDNA 2的架构设计,以及两项关键图形技术。 RDNA 2虽然是RDNA架构的更新版本,

访问:

阿里云双11全球狂欢季返场继续 – 双核8G云服务器首年286.44元

AMD RX 6000架构揭秘:性能提升多达54%

而在7nm工艺不变、核心规模翻番、频率大幅提升的同时,整卡功耗依然保持在最多300W。

本文中,我们重点讲讲RDNA 2的架构设计,以及两项关键图形技术。

RDNA 2虽然是RDNA架构的更新版本,并不是完全重新设计,但是它带来的突破和提升是惊人的,也完全实现了项目起步之初设立的看似不可能的目标。

这就是:16个月之内,性能提升1倍,能效提升至少50%,完整支持DX12 Ultimate等技术特性,支持硬件光线追踪。

在微架构上,RDNA 2充分借鉴了Zen CPU的世界级设计思路(消息称Zen开发团队直接介入了RDNA 2设计),整体得以更加精炼、高效。

纵向比较的话,在同等功耗水平下,RDNA 2每个计算单元的运行频率提升了足足30%,标称加速频率最高2250MHz,实际运行中其实能够跑到2450MHz!

横向比较的话,在同等频率下,RDNA 2每个计算单元的功耗可以降低50%,也就是省电一半。

以上是RDNA、RDNA 2两代架构图,可以发现整体布局没有太大变化,当然各个功能模块都是调整优化过的,而最突出的,一是增加了独立的Infinity Cache高速缓存,二是在每个计算单元内加入了专用的光追加速器Ray Accelerator。

至于RDNA 2架构的底层细节,比如说计算单元的变化,AMD这次没有给出更多资料,只是简单提到了几点,包括精简TLB以降低延迟、重新设计32位像素流水线并支持HDR格式、优化几何分派与曲面细分、全方位精细时钟门控、频率树分离与门控、最小化数据转移、重新平衡流水线、高性能库等等,但没有任何图示。

不过也好,太深入太专业的东西咱们也钻研不够,直接享受成果就是了。

Infinity Cache高速缓存的加入,以及一二级缓存的调整,主要是为了解决RDNA 2架构必须在核心数量翻番、频率提升30%的情况下,不会受到带宽不足的制约。

上一代的RDNA架构中,零级缓存分布在每个计算单元中,一级缓存是每个着色器引擎独享的,并单独访问二级缓存,4MB二级缓存则负责在着色器引擎、指令处理器之间共享数据。

RDNA架构搭配的是256-bit GDDR6显存,等效频率14GHz,总带宽为448GB/s,看起来不少,但核心规模急剧扩大后,就会成为瓶颈。

GPU发展的传统思路中,提升显存带宽的核心途径就是扩大位宽、提高频率。RTX 3090就拥有384-bit 19.5GHz GDDR6X,带宽高达936GB/s,AMD Fury、Vega系列显卡还用过以高带宽著称的HBM,Radeon VII就达到了惊人的1TB/s。

但是,扩大位宽会造成核心面积急剧扩大、功耗急剧增加,HBM显存则是成本高昂,还要与GPU整合封装。

Smart Access Memory(SAM)显存智取技术就是AMD提出的更高效的高带宽解决方案,而且充分依托了AMD的平台化优势。

NVIDIA虽然号称也在研发类似的技术,但没有自己的CPU处理器做辅助,就有点像无根之水了。

RDNA 2为此集成了128MB大容量的Infinity Cache高速缓存,有点像锐龙/霄龙处理器中的三级缓存,同时优化各级缓存结构的体系,还将二级缓存容量翻两番达到16MB。

再结合AMD CPU/GPU通用的Infinity Fabric高速互连通道,支持16×64-bit通道,最高频率1.94GHz,其带宽是256-bit GDDR6显存的几乎4倍!

按照AMD的说法,Infinity Cache高速缓存结合256-bit GDDR6显存,带宽可以达到384-bit GDDR6显存的多达2.17倍,而且还能节省10%的功耗——512-bit GDDR6或者4096-bit HBM也能带来类似或者更高的带宽,但是功耗和成本完全不可同日而语了。

与此同时,平均显存延迟也降低了足足34%。

再借助成熟的PCIe 4.0技术、自家平台优势,锐龙5000处理器、RX 6000显卡彼此搭配的时候,SAM技术可以将更多内存空间映射到本地存储地址寄存器中,让处理器访问显卡全部容量的显存,不再有任何限制,也彻底消除了带宽瓶颈。

SAM技术加持后,不但带宽瓶颈完全不存在,还有额外加成,官方宣称可给RX 6800 XT带来平均6%的游戏性能提升,最多超过10%。

在我们的实测中,RX 6800 XT开启SAM,游戏性能平均提升大约3%,《刺客信条:奥德赛》、《古墓丽影:暗影》、《战地5》、《战争机器》都是比较明显的,以前是《战争机器5》,1080p分辨率下达到了惊人的12%。

回想之前RX 6000系列规格曝光的时候,看到只有256-bit位宽,再加上AMD保密措施做得好,顶级规格一直没有透露,相信绝大多数人都认为AMD这次直接弃疗了,不做高端,结果谁都没想到来了一个这么一个独门大招。

当然,SAM技术需要特定的条件才能开启,硬件上不但需要锐龙5000处理器、RX 6000显卡,还得搭配X570、B550主板,并在BIOS中开启相关选项。

AMD表示,目前没有计划将SAM技术应用于老平台,所以400系列主板用户即便上了锐龙5000处理器,也会少一些“福利”。

再说说光追。RDNA 2的思路是在每一个计算单元内,加入一个专门的Ray Accelerator光追加速单元,这与在微软Xbox Series X/S、索尼PS5上的设计如出一辙,跨平台的游戏优化自然是得心应手。

对比NVIDIA RT Core专用光追核心的做法,RDNA 2将光追加速器集成于计算单元,可以共享通常无法在光追中无法被完全利用到的硬件。

换言之,运行非光追负载时,AMD光追加速器的部分硬件仍然可以正常运作,NVIDIA RT核心就完全闲置了,前者自然有着更高的整体效率,不必为根本用不到的硬件付出成本和功耗。

(编辑:应用网_阳江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读