【科普】6144流处理器的RX 7900 XTX,为何效率奇高?AMD如何给它加上“超线程”?

时间:2022-11-18 01:50:15编辑:coo君

2022年11月4日凌晨,AMD正式召开了RDNA3架构显卡的发布会。AMD也在官网上公布了RX 7900 XTX和RX 7900 XT两款旗舰显卡的规格。值得注意的是,RX 7900 XTX的流处理器有6144个,RX 7900 XT的流处理器有5376个,正好是之前曝光数量的一半。

RX 7900 XTX部分规格信息(来自AMD官网)RX 7900 XT部分规格信息(来自AMD官网)

有的玩家朋友可能会因为宣传的落差而感到有些失望,毕竟这样的规格,未免显得有点寒碜了,但是也没必要因此感到失望。在发布会上,AMD已经让大家见到了RDNA3架构显卡的性能,虽然流处理器数量提升不大,RX 7900 XTX的流处理器数量只是RX 6900XT的120%,峰值频率甚至没怎么提升(190MHz),但是在游戏方面的性能提升却达到了50%以上,且峰值功耗仅提升约6%,种种表现,都无不印证着RDNA3架构拥有着奇高的效率和能耗比。

为什么RDNA3架构能如此高效呢?奥秘就在它的流处理器上。一般来说,流处理器都是单发射结构的,也就是说,在一个时钟周期内,每一个流处理器只能取出1条指令,并执行该指令的编、解译;但是,在RNDA3架构中,每一个核心、每一个工作组处理器(WGP)、每一个计算单元(CU)中的每一个流处理器,都是双发射流处理器(Dual Issue Stream Processor),这也就意味着,在理想的状态下,每一个流处理器可以在一个时钟周期内,取出两条指令,并执行该指令的编、解译。RX 7900 XTX拥有48个WGP,也就是96个CU单元,每个CU单元依旧有64个流处理器(与之前的RDNA2、RDNA乃至GCN架构中一个CU所容纳的流处理器数量一致),算下来就是6144个流处理器,在理想的条件下,RX 7900 XTX能在一个时钟周期内,取出并执行12288个指令,就目前来讲,若是其它架构的显卡(范围限于一般的游戏显卡),则需要12288个流处理器,才能和RX 7900 XTX相媲美(假设时钟频率相同,且都处于理想条件下)。这就是RDNA3架构显卡效率奇高的重要原因之一。

针对游戏优化的统一的计算单元(取自AMD的RDNA3显卡发布会)通过高效的设计得到更高的性能(取自AMD的RDNA3发布会)

当然,众所周知,并非所有的条件都是理想的条件,RX 7900 XTX的6144个双发射流处理器也是不能每时每刻都当作12288个普通的其它流处理器来用的,在大多数情况下,这些流处理器的“双发射”结构,更类似于CPU中的超线程的存在,CPU中的超线程,可以让CPU的逻辑核心相对于物理核心翻倍,却不能让性能翻倍,同理,双发射流处理器可以让指令执行的最大数量翻倍,却也不能让执行效率翻倍,因为在绝大多数情况下,单个时钟周期内执行命令的数量不会是12288条。这就意味着6144个双发射流处理器依旧属于6144个流处理器,并不是12288个流处理器。但即便是这样,这种双发射结构也可以将流处理器的效率提升到极致了。

虽然双发射流处理器的双发射结构有点类似于CPU的超线程,但是它和超线程还是有些区别的,游戏需要针对CPU的超线程进行特定的优化,才能使得CPU在运行游戏的时候提高使用率,从而提升游戏性能,但是游戏并不需要针对双发射流处理器进行特定的优化,也能使得游戏性能得到提高。

总之,RDNA3架构显卡性能的提升,其实不仅仅归功于这些双发射流处理器,也归功于显存带宽的提升、AI加速单元的提升、光追单元的提升,等等之类的提升。但是,不可否认的是,流处理器从单发射到双发射的提升,是一种质的改变,是一种质的飞跃,也是RDNA3架构显卡提升性能的不可忽视的重要因素。虽然AMD的RX7000系列显卡的性能目前依旧没有击败英伟达的RTX40系显卡,但是凭借着AMD对玩家和消费者的态度,以及RX7000系显卡较低的功耗,没有烧接口的风险,再加上目前相对适中的价格,相信接下来AMD在显卡市场的表现,肯定不会亚于英伟达。

上一篇:《幸好不漂亮》:艳压群芳的王菊,美不美,我自己说了算

下一篇:【文娱热点】赵露思、陈哲远《偷偷藏不住》杀青;赵丽颖、欧豪《风吹半夏》即将播出