三星将自研GPU,RDNA2和Exynos有缘无分

三易生活 2024-05-08 21:01:02

在合作五年时间后,三星与AMD的缘分似乎要走到尽头了。日前有爆料信息显示,三星方面正在自研GPU、或将会放弃与AMD共同开发的Xclipse GPU方案,预计在2026年推出的Exynos系列新款SoC上将会抛弃AMD、改用自研GPU架构。

三星在移动端放弃AMD的RDNA GPU图形IP,转而再次开启自研GPU其实并不让人感到意外。自2019年三星与AMD达成合作协议算起,在这五年时间里基于RDNA GPU图形IP打造的SoC广为人知的其实只有两款,分别是2022年春季亮相的Exynos 2200和2024年的Exynos 2400,Exynos 2300则是由于三星自己GAA工艺的问题胎死腹中。然而遗憾的是,双方合作仅有的这些成果实际表现只能用差强人意来形容。

采用当时最新4nm制程,首次支持移动端光线追踪技术的Exynos 2200,可以说是完美诠释了高开低走,其最初曝光时跑分成绩直接碾压苹果的A14,甚至追上了桌面端的M1。可是如此夸张的跑分背后,却是三星将Exynos 2200基于RDNA打造的Xclipse GPU频率设置为1.9GHz,结果导致了无法解决的发热问题,以至于后续不得不将GPU频率从1.9GHz下调到1.69GHz、再降到1.49GHz,最后更是只能稳定在1.29GHz。

待到跳票多次的Exynos 2200与Galaxy S22系列一同亮相时,有好事者对比了Exynos 2200与同期高通骁龙8 Gen1的实际表现。结果在3DMark Wild Life的测试中,Exynos 2200的成绩比骁龙8 Gen1低了30%,GFXBench曼哈顿离屏测试的成绩也比后者低了24%。

到了两年后的Exynos 2400上,这一情况也并未发生根本性的改变。在一系列的性能基准测试中,这款SoC落后于同时代的骁龙8 Gen3达到了10-15%。

更为致命的是,三星押注的“移动光追”概念至今仍没有收到手机游戏开发者的青睐。在与AMD达成合作后,移动光追技术就被三星视为是新Exynos平台的一大亮点。事实上,Exynos 2400唯一对比骁龙8 Gen3取得优势的项目就是光线追踪,前者在3DMark Solar Bay光线追踪基准测试中的性能表现更强、且功耗却低于后者20.5%。然而遗憾的是,对于移动光追游戏开发者却并不感冒。

过去数年,除了《逆水寒手游》,整个业界的重点项目几乎没有哪一款会拿移动光追说事。而网易则一向是将《逆水寒手游》作为各种新技术的试验田,不仅仅是移动光追,诸如元宇宙、AIGC也都曾经出现在这款游戏中。由此可见,移动光追并未如桌面端的光追一般,在业界以及玩家群体中获得太多的影响力。

而开发者对于移动光追这个概念兴趣缺缺的原因其实也很简单,因为其既花钱、还很难作为一个吸引玩家的卖点。事实上,光线追踪的目的是模拟现实世界中水面倒影、物体表面的光线反射等细节,进而让游戏画面更加真实。

但真正在游戏中,玩家的视线往往都集中在自己控制的人物和敌方角色,以及地图、血量等信息上。桌面端显示设备的尺寸更大,因此玩家的视野更为宽阔,此时人眼动态捕捉能力有限的这个问题并不突出。可手机受到屏幕尺寸的限制,无论MMORPG、FPS,还是MOBA,玩家控制的角色往往都会占据画面的主体,这就导致了移动光追带来的画面细节提升,在玩家动态处理信息的过程中很容易被忽略。

换句话来说,移动光追带来的拟真感只能在静态画面上被感知,一旦画面动起来,玩家根本就体验不了光追所带来的沉浸感。反映在开发者层面,用更漫长的渲染管线和更高的性能开支,却只能换取聊胜于无的画面效果提升显然性价比不高,这也正是移动光追的命门。

那么问题就来了,三星和AMD强强联手搞出来的移动端GPU性能却不尽如人意呢?根源其实出在AMD贡献的RDNA 2上。这个架构固然让Exynos 2200/2400获得了光线追踪(RT)和可变速率着色(VRS)等高级图形功能,但RDNA 2作为一个原本应用在桌面端GPU的架构,它被设计是应用在PC、笔记本电脑和游戏主机上的,在移动端可以说是水土不服,毕竟它所使用的IMR渲染管线并不那么适合移动端。

所谓渲染管线,就是CPU传送给GPU一堆数据,GPU经过一系列处理最后渲染得出一副二维图像,而无数二维图像就共同构成了我们所看到的画面。桌面端GPU使用的IMR每一次渲染API的调用,都是按照管线的顺序处理每个图元,会直接绘制图形对象。所以IMR在每一次物体颜色和深度的渲染中,都要读写Frame Buffer(帧缓冲)和Depth Buffer (深度缓冲)。

IMR的优势就是渲染管线没有中断,因此有利于提高GPU的最大吞吐量、最大化地使用GPU性能,但代价就是需要巨大的内存带宽,而这一点在桌面端是使用L1、L2缓存的优化来解决。可遗憾的是,由于移动端GPU的体型和功耗限制,IMR长期以来是不被应用的,移动端GPU使用更多的是TBR (Tile-Based Rendering)渲染管线,其特点是就减少带宽开销,将帧缓冲分割为一小块一小块、然后逐块进行渲染,绘制完毕再将绘制写入到内存的帧缓冲中。

在Exynos 2200/2400之前,上一次在移动端GPU上使用IMR还是Tegra X1的Maxwell,当时英伟达为了使用IMR,直接就将升级的重点放在了内存带宽上,其理论峰值内存带宽从Tegra K1的14.9 GB/s升至25.6 GB/s。但以Exynos 2200为例,即使它使用了带宽可达51.2GB/s的LPDDR5-6400内存,但这款SoC的FP32浮点算力来到了1TFLOPS的水平,正好是Tegra X1的一倍。

Exynos 2200面临的问题其实与当年的Tegra X1大同小异,实际情况也确实如此,那就是同样都有超高的发热量。在内存技术没有革命性的进展之前,将桌面端GPU直接移植到移动端,在有限的芯片面积下还要兼顾CPU的性能和发热,简直就是在螺蛳壳里做道场。

显然并不是每一次弯道超车都能成功,所以在继续与AMD的合作对于Exynos而言已经没有太大意义的情况下,三星显然还不如以此为基础来打造自研GPU。

0 阅读:15

三易生活

简介:专注IT,最快最专业资讯!