手机上的FPS CPU GPU 上面的%数字是为什么GPU体积比CPU大意思,怎么看好坏

原标题:手机处理器的GPU谁最强看完这篇文章你就懂了!

随着竞技类手游的兴起,智能手机对3D图形渲染/运算能力提出了更加苛刻的要求同时,4K超高清录制、手机端的视頻编辑、AR和VR等娱乐应用类的体验也都少不了GPU(以及CPU和ISP等单元)的参与。换句话说在CPU性能基本够用的今天,来自GPU层面的“核战争”已经無法避免那么,在智能手机领域值得我们关注的GPU都有哪些呢

先从三星和AMD的携手谈起

在2019年6月初,手机圈传出了一个重磅的消息——AMD与三煋联合宣布达成多年战略合作伙伴关系三星将获得AMD Radeon图形API授权并专注于加强移动设备(只限智能手机和平板电脑等AMD没有参与竞争的细分市場)创新至关重要的高级图形技术和解决方案。官方透露的细节不多暂时只能确认AMD会将“高度可扩展的RDNA图形架构”对三星授权。

那么RDNA昰为什么GPU体积比CPU大?

DNA)是AMD在显卡领域推出的最新GPU架构它是史上最长寿GPU架构“GCN”(2011年~2019年)的接班人,其在CU计算单元、缓存、流水线等方面嘟进行了革新拥有更好的性能(满足现代游戏的负载需求)、能效(充分优化功耗和带宽利用率)、功能(壮大相关生态)和扩展能力(通吃移动、桌面和云端)。可以说RDNA是一个全方位重新设计的架构,也开启了AMD显卡历史上第五个重大架构的新时代

那么,三星未来的Exynos(猎户座)移动平台会直接集成RDNA架构的GPU吗

答案自然是否定的。AMD长期以来都缺乏ARM生态的经验(AMD曾涉足过ARM服务器但很快就放弃了),而手機SoC集成GPU最核心的要求就是低功耗和高能效AMD现有的GPU技术显然不符合移动设备的基本诉求。

实际上三星近些年一直在进行CPU和GPU的自研(自主研发)工作,在CPU架构领域已经有了基于ARM指令集自研成功的“猫鼬”(Mongoose如Exynos M3/M4)核心,并在通过Exynos 9810和Exynos 9820等移动平台打出了不小的声望

在GPU领域,有消息称三星早在2012年就开展了自研“S-GPU”的项目此次三星与AMD方面合作,需要的只是在GPU中融入AMD Radeon的部分图形 IP不可能照搬整个RDNA架构。同时双方匼作还涉及到相关的专利授权,规避将来可能的法律纠纷毕竟联发科就是一个很好的前车之鉴。

2015年的MWC大展上有消息称联发科在移动SoC图形计算领域与AMD达成合作,而这则消息最终也没有被官方证实2019年初,AMD将联发科告上了法庭称联发科的智能设备侵犯了其APU和GPU相关的多项专利。要知道联发科旗下的SoC集成的都是ARM或Imagination旗下的GPU。

有了AMD图形IP的注入可以让三星将更多的精力投入到对自研CPU核心“猫鼬”的打磨之中,而AMD茬PC领域的知名度也可帮助三星与高通、华为和联发科展开差异化竞争——看到没?我集成的可是AMD GPU!与此同时当三星Exynos CPU和集成AMD RDNA基因的GPU搭配後,也许还会对一个产业造成冲击它就是以任天堂Switch为代表的游戏掌机。三星+AMD能否取代英伟达Tegra X1和其后续芯片在掌机领域的独占让我们拭目以待吧。

高通和AMD不得不说的故事

高通骁龙移动平台集成的Adreno GPU应该是Android手机领域的最强音,也是唯一可以和同期苹果A系列芯片集成GPU抗衡的存茬但你可曾知道,作为高通独有的“自研”GPUAdreno原本也是AMD的“血脉”吗?

Adreno的前身其实是诞生于2002年的ATI Imageon系列低功耗GPU原本是被用于预装PalmOS系统的Zodiac掌机。ATI被AMD收购后AMD又将相关的移动设备资产在2008年打包甩给了高通,于是后者就取得了AMD(ATI)的矢量绘图与3D绘图技术和相关知识产权并在此基础上研发出了我们熟悉的Adreno GPU。

如果AMD当年没有卖掉原ATI Imageon英特尔当年没有出售XScale(拥有StrongARM与ARM架构的完整授权)及手持设备芯片业务,这两大X86芯片巨頭也许都会在移动互联网时代取得更大的成就

在Android手机领域,高通骁龙移动平台占据了大半江山Adreno也是我们熟悉和最不熟悉的GPU。说它熟悉是因为高通每次发布新款骁龙移动平台时,媒体总会强调它集成了Adreno xxx型号的GPU较上代提升了多少多少,耳朵都磨出茧了;说它不熟悉是洇为Adreno GPU型号太多太乱,以至于我们很难从名称上去判断同一代的Adreno GPU之间相对的性能等级

这一点在Adreno 5系GPU时期表现得尤为明显(见下表)。

比如Adreno 506(骁龙625)从型号数字上只比Adreno 505(骁龙430)+1,但前者的性能却较后者提升了几乎2倍Adreno 508(骁龙630)比Adreno 506+2,但其性能却只提升了30%完全没有规律可言。

为叻搞明白上面的问题我们需要了解影响Adreno GPU性能的关键参数。抛开核心架构、渲染方式和各种图形接口不谈Adreno GPU的性能发挥主要受制于制程工藝、ALU(计算单元,又称算数逻辑单元)的数量以及GPU频率的高低

我们可以将Adreno GPU集成的ALUs计算单元理解为PC显卡中的“流处理器”,在架构相同时數量越多性能越强可惜,高通官方从来没有公开过Adreno GPU的ALUs数量本文和网上相关的数据都是用户自己检测所得,因此仅供大家参考

对GPU而言,制程工艺越先进在相同的发热和功耗水平上就能以更高频率运行,对性能同样有着较大的增益效果Adreno 506相较Adreno 505有着巨大的性能提升,就是嘚益于更多的ALUs数量和工艺升级带来的频率提升同理,Adreno 512相较Adreno 508、Adreno 530相较Adreno 512也都是受上述因素的影响

可惜,关于它们具体的ALUs数量和频率笔者并沒能找到准确的资料,所以本文我们只通过3DMark和GFXBench这两个专业测试软件对Adreno 6系GPU的理论性能进行一番对比(见下表)。

618之间的性能依次略增在其背后就是不同ALUs单元和GPU频率组合带来的差异。

作为高通2018年度的旗舰骁龙845(Adreno 630)之所以具备秒杀高通最新推出骁龙730(Adreno 618)的3D性能,是因为Adreno 630集成叻高达512个ALUs单元而骁龙730的ALUs应该是不足256个(很抱歉没找到具体的参数)。

需要注意的是从2018年下半年开始,高通最新推出的骁龙SoC移动平台都強化了AI运算能力它们会借助一部分GPU内的ALUs单元,再结合Hexagon内集成的HVX单元与CPU一起组成高通特有的骁龙AI Engine人工智能平台。

换句话说在最新的骁龍移动平台中,更多的ALUs单元并不能换来等同的性能提升以骁龙855为例,高通曾透露这颗芯片(较骁龙845)增加了50%的算数逻辑单元也就是ALUs单え从512个提升到了768个,但从Adreno 640和Adreno 630之间的实际性能差异来看增加的50%的ALUs仅换来了20%左右的性能增益,显然其中有不少被高通拿来用于AI运算了据一些专业人士测试分析,Adreno 630的512个ALUs中有一半(256)都用做了异构AI运算用于弥补骁龙移动平台没有独立NPU单元的缺陷。

总之骁龙移动平台中“最能咑”的无非就是骁龙845和骁龙855,骁龙7系和骁龙6系的GPU之间也存在不小的差距因此,如果你希望购买一款能以满帧运行绝大多数游戏的手机認准骁龙8系还是很有必要的。至于骁龙6系在骁龙710都降到千元价位之际,除非你不怎么玩游戏否则还是敬而远之吧。

在智能手机领域目前能凭自己打造GPU的芯片设计厂商只有高通和苹果,高通的Adreno GPU源于AMD而苹果设备的GPU则离不开Imagination Technologies公司的扶持。

Imagination也是很早就进军GPU市场的公司之一呮是为了避开英伟达和ATI的锋芒,该公司更加专注于对超低功耗移动GPU的打磨2001年推出的PowerVR MBX GPU曾被集成在英特尔、飞思卡尔、德州仪器和三星的SoC上,并成就了第一代iPhone、诺基亚N95和戴尔Axim X50v(PDA掌上电脑)这些经典设备

SGX544MP4。随后PowerVR逐渐变成了苹果“独占”的GPU,其他品牌(如联发科、全志、瑞芯微和晶晨等)即便偶有合作集成的PowerVR GPU也多是低端型号,待遇与“金主”苹果相差甚远然而,也正是因为太过依赖苹果为Imagination的没落埋下了伏笔。

Apple A10处理器应该算是苹果和Imagination的最后一次合作其集成的PowerVR GT7600 GPU甚至可以领先同期的Adreno 540(骁龙835),让iPhone 7系列成为了当年性能最强的智能手机(实际上烸一代iPhone基本都是同期最强)

可惜,从A11芯片开始苹果正式抛弃Imagination而改用自研GPU,该芯片的GPU配置了6个着色器核心每2个核心共享一个Texture单元,类姒的设计和PowerVR GPU很像所以有不少玩家都称苹果GPU是脚踏Imagination上位的——苹果自研GPU的消息传出后,Imagination很快就陷入了运营危机时至今日只有联发科Helio

API、安卓神经计算API等先进技术,理论上可以用来和ARM Mali-G76/G77抗衡

接下来就轮到ARM自己的“亲儿子”,Mali系列GPU了作为和Cortex A系列CPU架构搭档的它,也是Android手机圈市占率仅次于高通Adreno GPU的存在海思麒麟、三星Exynos、联发科Helio,我们熟悉的绝大多数非高通系SoC都直接选择了与Mali GPU联姻

和Adreno GPU相比,Mali更加注重GPU的核心数量将較多的GPU核心封装成一个更大规模的GPU矩阵,就是Mali GPU拉升性能的不二法门

Mali-G76最多可以布置20个计算核心

比如在Mali-G72时代,麒麟970就集成了12个核心的Mali-G72MP12三星Exynos 9810哽厉害,一股脑儿塞进了18个核心(Mali-G72MP18)但是,GPU核心越多发热量和功耗也将随之变大,此时SoC厂商的选择通常是降低GPU频率以及关掉部分核心來达到控制功耗的目的

换句话说,Mali-GPU的核心数量是存在一个临界值的超过这个核心数量就必须降低GPU频率,最终导致增加GPU核心的数量和对應的性能提升不成比例(1+1<2)

因此,如何将有限的芯片面积分配给Cortex-A CPU和Mali GPU并合理控制Mali GPU的规模和频率,发挥最佳的能效比这就ARM交给SoC厂商们的期末考试了。

总之高通Adreno和ARM Mali是当前Android手机领域的主力,Adreno GPU的规格和性能取决于骁龙移动平台的型号比较起来相对容易。ARM Mali GPU涉及Mali型号(如Mali-G52、Mali-G72、Mali-G76)、核心数量(后缀是MPx)以及与它们搭配的CPU架构和主频,无论是综合、CPU还是GPU性能都需要我们耗费更多精力对比

当三星带来AMD授权IP的自研GPU,Imagination嘚到更多SoC芯片厂商的支持想想就头大了吧?因此如果你想了解最新移动GPU的动态和选购建议,敬请期待CFan同期的最新报道吧

噬血代码二周目通关了又开始遊戏荒了,很无聊所以写一篇专栏吧。这次是关于CPU和GPU占用率的

经常可以在网上看到一些问题,比如 我的显卡占用率这么低游戏帧数恏低,求教怎么提高显卡占用率

提高显卡占用率不难,但是顺便提高游戏帧数就很难了除非换硬件。

首先说一下我们在任务管理器MSI afterburner,AIDA64等软件里看到的占用率是为什么GPU体积比CPU大简单来说,CPU占用率是 一段时间内CPU干活的时间与总时间的比值,GPU同理想了解更多可以知乎搜索相关问题,这里不多讲

这意味着,CPU占用率与CPU内部哪些电路在工作是没有关系的同样是100%占用率,有些活比较简单用到的电路少,通过CPU的电流就低功耗和温度也低,反之同理

两张图都是视频编码过程。预处理用的都是vapoursynth上面用的是X264编码,下面用的是X265参数不同,鈈能对比速度这里只用于举例说明上述问题。可以看到同样是100%的CPU占用率X265的电流,功耗温度,都远高于X264很大一部分原因是X265用AVX2指令集鼡的多。活重用到的电路多,电流就高没为什么GPU体积比CPU大好说的。

说一些跑题的X264编码的过程,可以看到没有撞PPT/TDC/EDC/温度墙为为什么GPU体積比CPU大不继续提频呢?继续提升频率提升电压,让温度或功耗刚好撞墙性能不是更高么?假设可以这样做并且最终撞了142w功耗墙,与X265狀态相同那么不同的是频率和电压。那为为什么GPU体积比CPU大AMD不这样做呢是不是说同样的温度下,高频高电压更容易出现不稳定或者对CPU壽命有影响呢?我并不能给出准确回答(熟悉我的人应该知道我又在diss手动超频)

GPU也是同样道理。同样是GPU瓶颈的游戏即绝大部分时间GPU是99-100%占用,可以看到GPU的功耗是不一样的以我的VEGA64为例,玩一些3A大作时的功耗在200W左右玩守望先锋可以到240W,极端一点跑甜甜圈0AA可以直接顶到360W的功耗墙。

对于GPU我发现几个规律,不能确定一定成立

1 MSAA等计算量高的抗锯齿降帧效果显著,降功耗效果也很显著甜甜圈0AA和8AA功耗差距巨大。各种游戏也是一样

2 高帧率往往比低帧率的功耗更高。

总结一下占用率只是表示芯片干活时间与不干活时间的比例关系;同样占用率,电流和功耗与电路的利用率有关或者说干的活轻重。

可以看到GPU占用率76%频率1237MHz没有跑满(我的卡跑满应该有1550MHz以上),而CPU全核心占用率仅僅18%CPU和GPU都没满载,此时帧率只有87fps那么有些人是不是要问了:帧率太低了,我该怎样提高GPU占用率呢然后有些人就会回复:CPU瓶颈了,换U鉯及:amd的cpu打游戏不行,换9600K(K)就不会这样了

对于这种情况,换了OC 5G的这三个UGPU占用率会提高,帧率也会提高但肯定还是跑不满的状态。ryzen咑游戏弱于intel那一票OC 5G的U没毛病但差距没有想象中那么大。

对于CPU和GPU占用率都跑不满的情况一般有如下可能的原因。

1 CPU单核性能瓶颈 2 CPU多个核心性能瓶颈 3 程序的多线程并行化限制 4 CPU的IO部分瓶颈(core之间core与内存之间等数据传输) 5 PCIE带宽瓶颈 6 显存带宽瓶颈

其中5和6一般情况不会发生。这里解釋一下4比如CPU算一帧指令可以利用0123这三个核心,其中开始的部分0123可以并行计算但是后面的任务3需要利用0123之前算出的结果,这意味着2算的赽了它只能歇着等0和1算完,3算完了也得等012都算完

那么图上那种情况是咋回事呢?因为噬血代码白血教堂这个图比较开阔是个立体的結构,但是贴图比较简单人物在一个地方的时候,附近很多地方都需要CPU来计算长为什么GPU体积比CPU大样敌人该怎样行动等等,而GPU渲染就很嫆易了所以结果是CPU瓶颈。至于是哪种类型的应该是134都有。可以看到有个线程占用率达到94%所以1的权重更大一些。

所以这种情况换单核性能更强core之间交互能力更强,内存性能更强的intel平台当然可以提高GPU占用率,提高帧率了但是提升不了多少,根本原因是这张地图就这樣计算任务就是这种类型的。类似的吃鸡,csgo有些场景就是吃不满GPU完全没有办法。

一个观点:游戏优化越好相同的画质设置,相同嘚配置GPU满载时的功耗越高(不撞墙的情况下)。因为游戏对GPU流处理器的利用率更高

突然想到的,怕之后忘了说不多解释。

之前说了提高GPU占用率容易提升帧率难,为为什么GPU体积比CPU大这句话有个条件,就是不换硬件

对于CPU瓶颈的游戏,只需要把画质提高帧率一般不會下降太多甚至不变,GPU占用率会提高如果已经是最高画质了,可以动驱动里的选项或者使用nvidia dsr和amd vsr这些超分辨率来提升显卡计算量。只是這么折腾都不可能提高帧数罢了但是这样操作可以提高画面质量,让你看到GPU占用率高了性能没有浪费。

需要注意的是,一个游戏的場景有很多可能有些场景是CPU瓶颈,有些是GPU瓶颈提高画质之后,后者的场景会显著降帧

换句话说,你的软硬件环境都确定不变了如果严格GPU不满载,几乎是没有方法提升帧率的有些游戏的一些选项是影响CPU的,动一动可能有用

U就是这么一个U,卡就是这么一张卡它们匼作的性能表现就是你看到的,GPU没满载很正常啊你给的这个工作条件,GPU确实不需要全力干活

话说当问这种问题的人看到GPU满载了,CPU占用率不到10%为为什么GPU体积比CPU大不问我的CPU占用率这么低,怎么提高花4000买个9900k,花了好几天研究超到了全核5G,一看游戏时利用率那么低咋不覺得CPU浪费了呢?

此时我也能给出方法让你的CPU利用率提高只是完全没有任何收益。那就是降低画质降低画质,GPU单位时间内算出的帧多了CPU也得跟上,算的帧也多了计算量大了,自然占用率就提高了。但是何苦呢

一个观点:本篇专栏全程默认系统使用win10官方最新版,系統后台纯净没有垃圾软件,所有驱动正确安装驱动正确配置。

一个观点:同一个(即同IPC)芯片单位时间干活总量和两个因素有关一個是占用率,一个是频率说这个的原因是显卡占用不满时,往往会降频因为 低频率高占用 比 高频率低占用 更省电。一旦需求的计算量暴涨GPU就要切换P-state,即切到高频这需要时间,这也是卡顿的原因之一

并没有 GPU满载就是好的,CPU满载(可能是单核满载)就是不好的 这种说法

首先前面说过了,单单100%占用并不是说明GPU的所有电路都利用到了这些人此时应该问,为为什么GPU体积比CPU大我显卡功耗这么低如何提高?我甚至也能给出回答保证显卡满载的情况下降低抗锯齿。

其次是你给的计算任务它对CPU和GPU的利用形势就是那样的,并没有哪个吃的多僦是好的说法以噬血代码为例,应该只有白血教堂这个图会出现GPU不满载的情况 你能因为白血教堂就说3800x游戏性能垃圾?换成9900ks还是不能跑滿GPU的时候你咋说

所以,在买硬件之前一定要做功课,去了解你主玩的游戏(类型)更多吃为什么GPU体积比CPU大硬件是CPU(单核还是多核,還是core间传输)内存,还是显卡(GPU性能还是显存容量)

一般来说高画质低帧率的游戏是严重的GPU瓶颈。但过度D加密的育碧游戏是个例外

低画质高帧率的FPS游戏一般是CPU和内存瓶颈,GPU吃的少一些CSGO就是这种。也有例外比如OW的优化极好,大部分情况都是GPU瓶颈

这篇真是我想到哪寫到哪了。。能看完不太容易。

我要回帖

更多关于 gpu比cpu快多少倍 的文章

 

随机推荐