平板跑步机可以跑这个游戏吗

只为尽情畅玩 开年必备的游戏平板推荐
作者:中关村在线 刘雪雯
  第1页:磅礴气势体验 苹果iPad Pro
  如今平板电脑市场的争夺战可谓硝烟弥漫,虽说苹果iPad依旧畅销,但受限于该产品的创新性缩水,而可与其匹敌的平板数量增多,使得其更受到不小的打击。与iPad相较的产品不仅在配置性能上有所靠近以及超越,更多的是在功能方面。鉴于这样的优秀平板较多,为了方便消费者选购,笔者只从其中挑选了八款较为出色的产品,不仅性能更强,同时优化好,运行也更为流畅。此外,由于消费者在购买平板电脑时更重视娱乐性,这八款产品堪称目前市售平板中拥有最出色游戏性能的明智之选,喜欢的朋友不可错过。
只为尽情畅玩 开年必备的游戏平板推荐
  磅礴气势体验 iPad Pro
  拥有苹果最大屏幕的iPad Pro,12.9英寸屏幕尺寸及分辨率,超大屏幕带给你非凡视觉体验;该机采用A9X处理器,系统内存4GB,储存容量有32GB和128GB两个版本,高配置带来更加流畅的视觉体验和操作体验;当前,这款京东热卖6788元。
苹果iPad Pro
  编辑点评:
  iPad Pro超大屏幕可实现iOS分屏功能,因此不仅娱乐体验优异,在在办公方面也是得天独厚。机身采用铝镁合金材质,产品重量713g,有银色,金色,深空灰色三种颜色选项,并可选择搭配Apple Pencil和Smart Keyboard,极佳的手感的极速游戏娱乐体验,谁用谁知道。
苹果 iPad Pro(32GB/WiFi版)
2015年11月
娱乐平板电脑
处理器型号
不支持容量扩展
屏幕分辨率
屏幕像素密度
电容式触摸屏,多点式触摸屏
防指纹涂层,视网膜屏幕,全层压显示屏,抗反射涂层
支持多国语言
双频(2.4GHz+5GHz),支持802.11a/b/g/n/ac无线协议
不支持3G网络
支持,蓝牙4.2模块
双立体声扬声器
内置麦克风
支持播放2160P视频
双摄像头(前置:120万像素,后置:800万像素)
前置:F2.2光圈/背照式感光/自动HDR照片和/优化的面部识别功能/连拍快照模式/曝光控制/计时模式,后置:iSight摄像头/自动对焦/F2.4光圈/五镜式镜头/混合红外线滤镜/背照式感光/优化的面部识别功能/曝光控制/全景模式/连拍快照模式/轻点对焦/照片地理标记功能/计时模式
支持录制1080P视频,慢动作视频,延时摄影视频,视频防抖动功能,优化的面部识别功能,三倍视频变焦,视频地理标记功能
支持AAC,HE-AAC,MP3,MP3 VBR,AAX,AAX+,AIFF,WAV格式
支持H.264,M4V,MP4,MOV,MPEG-4格式
支持JPG,GIF,TIFF格式
支持TXT,RTF,VCF格式
3.5mm耳机接口
Lightning接口
传感器/Home按键,开关按键,音量按键
聚合物锂电池
10小时左右,具体时间视使用环境而定
电源适配器
100V-240V 自适应交流电源供应器
加速感应器,环境光线感应,指纹识别传感器,三轴陀螺仪,气压计
指纹识别功能,数字指南针,iBeacon微定位
邮件,照片,信息,日历,视频,Siri,提醒事项,通讯录,相机,备忘录,时钟,Podcast,Photo Booth,报刊杂志,Game Center,iBooks,App Store,地图,Safari,音乐
Pages,Numbers,Keynote,iMovie,GarageBand,iTunes U,查找我的iPhone,查找我的朋友,Apple Store,遥控器
305.7×220.6×6.9mm
铝镁合金材质
银色,金色,深空灰色
  苹果 iPad Pro(128GB/WiFi)
  [参考价格] 6788元
第2页:满足所有向往 联想YOGA平板3
  满足所有向往 联想YOGA平板3  在这个“重设计、重体验”的年代任何一款产品再花哨也要围绕两个参数指标来设计,一个是重量另一个则是用户体验,外观设计的独特性能与从用户出发的设计在很大程度上决定产品能否抓住用户购买的心理,而YOGA平板3正是这是这样一款旅途便携神器。
支持触控、站立、阅读、悬挂四种使用模式
  联想YOGA系列平板可以说是多模平板的开创者,YOGA平板3沿袭了YOGA的经典设计,配备了旋转支架,有多个清晰的档位,支持触控、站立、阅读、悬挂四种使用模式,可以非常好的适应使用场景。YOGA平板3搭载高效电池组,续航时间可达20小时之久,让你的旅途不再枯燥乏味。  联想YOGA平板3采用的卷轴式设计可以把更大的扬声器装入其中,实际体验的音量和音质也要比其他平板好很多,同时左右双扬声器的分布卷轴两侧不仅能够获得更好的立体声效果,而且在握持使用时也避免了手掌对扬声器的遮挡。
左右双扬声器的分布卷轴两侧不仅能够获得更好的立体声效果
  除了不错的扬声器外联想YOGA平板在软件优化上也独具匠心,与杜比深度合作把杜比音效调节软件加入到系统之中,针对电影、音乐、游戏和语音等进行了不同的调整优化,能够获得更佳的听觉体验,模拟3D环绕音效,外放或者通过耳机收听,都可以享受到现场的震撼感。
  联想YOGA 平板3
  [参考价格] 2499元
  第3页:轻薄便捷利器 三星Tab A 8.0
  轻薄便捷利器:三星Tab A 8.0
  三星GALAXY Tab A采用了全新的机身材质,超轻超薄的机身设计,仅7.5mm的厚度,极具便携性。不止于轻薄,GALAXY Tab A还借鉴了三星备受欢迎的旗舰手机Galaxy S6圆润流畅的流线设计,将摩登风格集于一身。为确保用户安全携带,GALAXY Tab A还可以配合使用三星独有的卡扣式保护套,保护更加轻便人性化;
  编辑点评:
  这款GALAXY Tab A在配置方面优势明显,整机采用三星特殊机身材质。硬件配置为高通骁龙410四核处理器,主频1.2Ghz,集成Adreno 306图形显示核心,它的优势在于集成高通基带,所以支持移动、联通、的4G手机卡进行通话和数据连接;
三星Tab A 8.0
三星 GALAXY Tab A 8.0(T350)
2015年06月
娱乐平板电脑
Android5.0
处理器架构
处理器主频
处理器核心
支持Micro SD(TF)卡,最大支持128GB
屏幕分辨率
屏幕像素密度
电容式触摸屏,多点式触摸屏
支持多国语言
双频(2.4GHz+5GHz)
不支持3G网络
支持,蓝牙4.1模块
内置扬声器
内置麦克风
支持播放720P视频
双摄像头(前置:200万像素,后置:500万像素)
支持录制1080P视频
支持MP3等格式
支持MP4等格式
支持JPEG,GIF,BMP格式
支持TXT等格式
1×Micro-USB2.0
3.5mm耳机接口
电源接口,存储卡接口
开关按键,音量按键
锂电池,4200毫安
具体时间视使用环境而定
电源适配器
100V-240V 自适应交流电源供应器
内置GPS导航
智能重力感应,环境光线感应
Samsung Apps
208.4×137.9×7.4mm
白色,银色
  三星Tab A 8.0
  [参考价格] 1699元
第4页:极速畅玩不简单 七彩虹G808八核
  便携畅玩利器:七彩虹G808八核极速
  七彩虹G808八核(极速版)根据手游体验进行优化,功能也更为全面,配备了2GB大容量内存,配合MTK6592超强八核心处理器,使其能够畅玩市面上主流3D游戏,完美迎合当下青年人的娱乐需求。该机依然支持3G双卡双待通话功能,游戏、通话都能轻松搞定。目前,这款平板电脑热销中,售价549元。
  编辑点评:
  七彩虹G808八核 极速版尤为明显的就是七彩虹官方根据手游体验进行优化,为手游用户带来极致体验,这款产品可以说更多的是娱乐平板。此外,在硬件方面,处理器核芯提升到“真八核处理器”联发科MT6592处理器,它基于台积电28nm工艺制程,拥有八颗ARM Cortex-A7 CPU,并且可以同时运行,单颗CPU核心主频最高能达到2.0GHz。给整机运行流畅程度提供了保证。
七彩虹G808八核 极速版
七彩虹 G808 八核(极速版)
2015年04月
娱乐平板电脑,手机平板电脑
Android4.4
处理器架构
处理器型号
MTK6592 ARM Cortex-A7
处理器主频
处理器核心
支持Micro SD(TF)卡,最大支持32GB
屏幕分辨率
屏幕像素密度
电容式触摸屏,多点式触摸屏
支持多国语言
支持802.11b/g/n无线协议
联通3G(WCDMA),移动2G(GSM)
支持,蓝牙4.0模块
内置扬声器
内置麦克风
支持播放1080P视频
双摄像头(前置:30万像素,后置:200万像素)
支持录制720P视频
支持MP3,AAC,AAC+,EAAC+,AMR,WB-AMR,MIDI,OGG等格式
支持MKV,MP4,AVI,RV/RMVB,VOB,WMV,MPG,TS格式
支持JPG,BMP,GIF,PNG格式
支持TXT等格式
1×Micro-USB2.0
3.5mm耳机接口
存储卡接口,Micro-SIM卡插槽
开关按键,音量按键
锂电池,4000毫安
具体时间视使用环境而定
电源适配器
100V-240V 自适应交流电源供应器
内置GPS导航
智能重力感应,环境光线感应,距离感应器
支持通话功能
206.5×122×9.6mm
  七彩虹G808八核 极速版  [参考价格] 549元
性能升级不输任板 谷歌Nexus 9
  谷歌Nexus 9是一款能够与苹果iPad相抗衡的安卓平板,该机拥有较为高端的配置。其配备了NVIDIA Tegra K1芯片,同时还具备Android 5.0操作系统,拥有众多新功能。此外,用户可以双击屏幕来唤醒设备,使用访客账户登录到平板,在锁屏界面直接和通知进行交互,或是对特定的应用进行锁定。Nexus 9平板售价399美元起(约合人民币2443元),感兴趣的朋友可以关注一下。
谷歌Nexus 9
  谷歌Nexus 9采用8.9英寸分辨率显示屏,屏幕品质也让人印象深刻,色彩保真度也让人满意,能够带来不错的视觉体验。此外,该机拥有800万像素的后置摄像头,具备自动对焦功能,f/2.4光圈,可支持1080p视频录制,满足用户日常拍摄需求。
Google Nexus 9
2014年10月
娱乐平板电脑
Android5.0
处理器架构
处理器型号
Nvidia Tegra K1
处理器主频
处理器核心
不支持容量扩展
屏幕分辨率
屏幕像素密度
电容式触摸屏,多点式触摸屏
视网膜屏幕,Gorilla Glass 3
支持多国语言
支持802.11a/c无线协议
联通3G(WCDMA),联通2G/移动2G(GSM)
支持,蓝牙4.1模块
内置扬声器
内置麦克风
支持播放2060P视频
双摄像头(前置:160万像素,后置:800万像素)
自动对焦,F2.4光圈
支持录制1080P视频
支持MP3等格式
支持MP4等格式
支持JPEG,GIF,BMP格式
支持TXT等格式
1×Micro-USB2.0
3.5mm耳机接口
电源接口,nano-SIM卡插槽
开关按键,音量按键
锂电池,6700毫安
9.5小时左右,具体时间视使用环境而定
电源适配器
DC(5V,1.5A)自适应交流电源供应器
内置GPS导航,支持GLONASS导航
智能重力感应,环境光线感应,磁力感应,三轴陀螺仪
支持NFC技术,支持指南针
支持双击唤醒功能
228.25×153.68×7.95mm
白色,金沙色
  谷歌Nexus 9  [参考价格] 399美元起
  第6页:极致娱乐新体验 蓝魔i9s游戏版
  极致娱乐新体验 蓝魔i9s游戏版  蓝魔i9s游戏版内置英特尔Z3735F四核芯片,主频高达1.8GHz,其采用64位X86架构,可以支持大型游戏流畅运行,毫无卡顿,战斗根本停不下来。目前,该机在京东商城火热销售中,售价999元,值得玩家入手。
蓝魔i9s游戏版
  蓝魔i9s游戏版采用Intel Gen 7 Graphics显卡,支持DirectX11特性,拥有646MHz主频,2D/3D图形渲染能力超强,性能可比肩PC桌面级显卡,强大的游戏性能让玩家无法想象。此外,蓝魔i9s游戏版还可以连接量身定制的蓝牙手柄,完美结合游戏平台,与内置游戏同步启动连接,加强游戏操控感。
蓝魔 i9s游戏版
2014年10月
娱乐平板电脑
Android4.4
处理器架构
处理器技术
英特尔芯平板
处理器型号
Intel Atom Z3735F
处理器主频
处理器核心
Intel HD Graphic
Flash 闪盘
支持Micro SD(TF)卡,最大支持32GB
屏幕分辨率
屏幕像素密度
电容式触摸屏,多点式触摸屏
五点式触摸屏
支持多国语言
支持802.11b/g/n无线协议
不支持3G网络
支持,蓝牙4.0模块
内置扬声器
内置麦克风
支持播放1080P视频
双摄像头(前置:200万像素,后置:500万像素)
支持录制1080P视频
支持MP3等格式
支持MP4等格式
支持JPG,BMP,GIF,PNG格式
支持TXT等格式
1×Micro-USB2.0
3.5mm耳机接口
1×Micro-HDMI接口
电源接口,存储卡接口
开关按键,音量按键
锂电池,8000毫安
8小时左右,具体时间视使用环境而定
电源适配器
DC(5V,2A)自适应交流电源供应器
内置GPS导航,支持A-GPS定位,支持GLONASS导航
智能重力感应,电子罗盘
闹钟,日历,计算器,日程表,世界时钟
预装睿悦游戏平台APL,内置游戏(疯狂飙车8,异形地带,星际斗兽场,英雄战魂,封魔,魂斗士,永恒之剑,钢铁死神,滑雪大冒险,3D热血坦克,神守卫)
233.8×145.7×8.55mm
平板电脑主机 x1
  说明书 x1
  保修卡 x1
  合格证 x1
  USB数据线 x1
  充电器 x1
  支架 x1  游戏手柄 x1
  蓝魔i9s游戏版  [参考价格] 999元
第7页:百变配件拒绝平庸 华硕Z380KL
  百变配件拒绝平庸 华硕Z380KL
  华硕ZenPad 8.0 Z380KL在外观设计上,华硕秉承对高品质的不断追求才能开拓具有时尚质感的产品外观,经过精心设计和打磨的产品,源自“zen”禅意的启发,浮雕式皮革蛇纹花纹,为ZenPad带来摩登时尚感, 简约时尚的设计呈现力与美的结合。目前,这款平板京东商城售价1399元,值得入手。
华硕ZenPad 8.0采用8.0英寸显示屏
  华硕ZenPad 8.0(Z380KL)搭载高通骁龙强效八核CPU,支持多任务高速处理能力及高速网络连接,能在多媒体性能与电池续航之间取得平衡。高速4G LTE连接,为您带来快速的使用体验和长效的续航时间,随心所欲尽享无限欢乐。该平板同时支持五种通信模式和十个相应频段,可以提供各种通信模式和相对应的频段之间互相独立不受干扰,轻松实现沟通无阻。
华硕ZenPad 8.0
  华硕ZenPad 8.0(Z380KL)具有极高的屏占比,超窄边框设计,高达76.5%屏占比,无论视频赏析,影音娱乐,尽显大屏视觉享受带来的乐趣。而全新的ZenUI交互界面搭配Android 5.0系统,领整体使用体验更加友好。所谓百变,正是由于华硕ZenPad 8.0(Z380KL)背壳的特殊设计,可更换为电池背壳或者音箱保护套。一方面可以大幅度增强续航能力,另一方面又可以提高影音体验。
  华硕ZenPad 8.0(Z380KL)
  [参考价格] 1399元
第8页:非凡体验 戴尔Venue 10 7000
  多能非凡体验 戴尔Venue 10 7000
  全新戴尔Venue 10 7000平板电脑,配备了分辨率的10.5英寸微边框OLED显示屏,大视角下画面依旧清晰不失真。搭载了四核凌动Z3580处理器,更配有2GB内存和16GB硬盘,带来极为出众的表现。目前,该机在戴尔官网促销,热销3799元,可谓是一款高端大气的平板之选。
  编辑点评:  戴尔Venue 10 7000创新滚轴设计使用户易于单手持握和携带,并配备支持5种变形模式。其采用英特尔实感技术3D摄像头可以为每张照片拍摄深度地图。该平板电脑还安装了直观的Dell Gallery应用,配备了选择性重新聚焦和测量功能以及智能,可以为用户自动整理照片。此外,用户可选戴尔Venue键盘,ABS树脂机身,耐磨耐热携带轻便。
戴尔Venue 10 7000
戴尔 Venue 10 7000(WiFi版)
2015年05月
笔记本平板电脑,商务平板电脑
Android5.0
处理器架构
处理器技术
英特尔芯平板
处理器型号
Intel Atom Z3580
处理器主频
处理器核心
Intel HD Graphic
支持Micro SD(TF)卡,最大支持512GB
屏幕分辨率
屏幕像素密度
电容式触摸屏,多点式触摸屏
OLED触摸屏
支持多国语言
支持802.11a/c无线协议
不支持3G网络
支持,蓝牙4.0模块
立体声扬声器
内置麦克风
支持播放2160P视频
支持录制1080P视频
支持MP3格式
支持MP4格式
支持JPEG,GIF,BMP格式
支持TXT格式
1×Micro-USB
耳机/麦克风二合一接口
电源接口,存储卡接口
开关按键,音量按键
锂电池,6000毫安
10小时左右,具体时间视使用环境而定
电源适配器
100V-240V 10W 自适应交流电源供应器
智能重力感应
243.36×195.43×6.2mm
ABS树脂材质
  戴尔Venue 10 7000
  [参考价格] 3799元
(责任编辑:张春元 )
01/13 18:0201/11 17:0912/16 10:1412/15 05:3712/09 16:1312/04 15:1311/27 09:5111/23 16:24
科技精品推荐
每日要闻推荐
精彩焦点图鉴
  【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。[text]返回顶部&/&移动GPU全解读,手机平板跑大型游戏该用什么GPU?围观&·&&0评论&·&&0香蕉&/&&&/&&已收藏&/&&/&移动GPU全解读,手机平板跑大型游戏该用什么GPU?
感谢作者 ioncannon和爱搞机……原文地址:
上半部分/1218-vv-gpu.html 下半部分
本文将从移动GPU的结构、参数、兼容性、跑分几方面让读者全方位对移动GPU有一定的概念。&前言现在移动设备的“核战”越来越激烈,已经从CPU引发到了GPU上,于是“16核”、“8管线”、“MP4”、“三角形生成率”和“填充率”等各种吸引眼球的宣传铺天盖地而来。一直很希望能有些文章来介绍科普下,但或许是专业人士都觉得这些太基础,最后忍不住,只能由我这个半桶水的非专业人士来写点啥了。本文参考和引用了网上的一些资料,篇幅有限恕不一一列举。内容尽可能的科普浅显,但限于个人的知识层次、理解能力和表达能力,如果有不确切或者错误的地方,还请多多指正。&基本的3D流水线首先我们来简单的介绍下3D的画面是如何生成的,一个基本的3D流水线如下图所示:
首先,运行在CPU上游戏引擎根据游戏中的一些参数,产生一系列的图元,将它们的顶点数据发送给GPU。第二步,顶点处理器(Vertex Processor)对顶点数据进行一系列的变换和光照处理。简单的想想,游戏中的各个物体的坐标都是参照游戏中的世界坐标系的,而实际显示的画面是玩家视角或者摄像机视角,这中间就有许多坐标系的转换。这些活就需要顶点处理器来做,最终我们得到了我们所需要视角的画面。但是,到这一步,画面还只是一些多边形,而实际显示在屏幕上的是一个个像素,这里就需要Rasterizer进行光栅化(Rasterization,3),从而将画面变成一个像素图。第四步,对这些像素进行上色,Fragment Processor中的像素着色器(Pixel Shader)按照程序规定的算法,计算出画面中每个像素的颜色,之后第五步就是把结果输出到内存中,全部完成后拿去显示。当然在这整个过程中,还跟纹理贴图6有关系。所谓贴图就是把纹理(一个二维的静态图片)按照一定的算法给贴到游戏里的三角形表面上去。
&参数,究竟靠不靠谱?终端厂商在宣传他们手机芯片的GPU如何强劲时,往往会提到一些参数,最常见的就是三角形生成率和填充率。但实际上,不同公司的GPU,他们的这些理论参数,并不具有直接的可比性。我们也可以发现,有些GPU可能给出的理论参数很高,但实际表现却很一般,甚至不如一些参数低的GPU。这是因为,各个GPU的供应商,比如IMGtec(PowerVR SGX),高通(Adreno),Vivante(GC系列),ARM(Mali),nVIDIA(GeForce),他们给出这些理论数据的测试方式,可能不太一样。
比如三角形生成率,本身就受到很多测试因素的影响。例如,有些三角形在一开始就会被剔除掉(比如在屏幕外,或者太小了根本覆盖不到一个像素),不会被显示也不会需要执行太多的运算,那么这部分三角形到底应该算吗?如果算进去的话,三角形生成率自然就高了。或者,测试程序把一些已经计算好的坐标提交给GPU,那么GPU的Vertex Shader就不需要进行复杂的计算,数值自然就高了。再或者,并非生成一个三角形就一定需要处理三个顶点。如果有三角形共享顶点,用indexed的办法绘制,顶点的数目就可以减少。就像下图,2个三角形只需要处理4个顶点。如果测试的时候大量使用这种方式,也可以提高三角形生成率的数值。
同样,填充率反映了GPU的像素输出能力。但是厂家给出的理论值,很多都是没有贴图,没有Shader计算,仅仅是生成无色点的能力,跟实际使用的情况有较大的差距。又比如Imagination Technologies 的PowerVR SGX系列给出的填充率,并不是实际值,而是实际值乘以了一个2.5x的系数。这是由于PVR GPU架构的特殊性,可以剔除画面中被遮蔽的部分,不作渲染,减少了无用功。200MHz的SGX540,原生的填充率是400M,而由于这种技术的存在,IMG认为其等效填充率相当于1000M。在实际的场景中,如果遮蔽的部分较多,这个系数可能远超过2.5x。当然,如果场景中遮蔽较少,这个系数相应的也会变小。&事实上三角形生成率和像素填充率作为衡量GPU性能的参数,在PC平台上,几年前就已经被淘汰了。由于从DX8开始,现代GPU都已经由可编程的Shader来代替固定功能的单元实现各种特效,所以Shader的计算能力成为很重要的一点,在移动平台也是一样的。&移动平台的特点和移动GPU的架构不过呢,移动平台相比于PC平台,还是有很多不同的。从本质上看,是由功耗和体积两方面限制的,对于图形处理来说,主要是两点:
第一,是有限的带宽。实际上,要增加计算能力,在功耗允许的情况下,堆核心并不是一件难事,事实上我们也看到了不少SOC集成了四核乃至“16核”GPU。但是难点在于,需要有足够的带宽去满足这颗强大的GPU,避免其出现“饿死”的情况。在左图的移动平台中,CPU、GPU和总线被共同集成在一颗芯片上,称之为SOC。整个SOC,包括其中的CPU和GPU,共享有限的内存带宽。即使是相对高端的,采用64bit内存位宽的一些SOC,如三星4412,高通8064等,也只是6.4 - 8.5GB/s的带宽,相比起PC平台主内存十几GB/s的带宽,和PC GPU GDDR5显存动辄几十,不少都超过100GB/s的带宽,只能说是少的可怜。相对另类的苹果在iPad4中,给A6X芯片搭配了128bit的LPDDR2-1066,带宽达到了17GB/s,用以喂饱强大的SGX 554 MP4 GPU,但相比PC平台依旧是小巫见大巫。因此,移动平台要在有限的带宽下实现合理的性能,在不少时候,瓶颈可能并不在于计算能力上,而在于带宽上。&第二,相比PC平台的CPU,移动平台的CPU浮点较弱,在Cortex-A9开始虽然有所好转,但64bit的NEON跟桌面128bit甚至256bit的SIMD还是有显著差距,外加主频的差别。因此更多的计算也依赖硬件Vertex Shader去完成。&因此,移动平台的GPU相对于PC平台,也会有一些不同。我们回过头来看一下移动平台的GPU的一些架构。首先是传统的IMR(Immediate Mode Rendering)架构&目前几乎左右的桌面GPU(nVIDIA,AMD)都是IMR架构,在移动领域,nVIDIA的GeForce ULP和Vivante的GC系列GPU都是属于IMR架构。IMR架构的GPU渲染完物体后,都会把结果写到系统内存中的帧缓存里,因此就可能出现GPU花了大量的时间渲染了一个被遮挡的看不见的物体,而最后这些结果在渲染完遮挡物后被覆盖,做了无用功。这个问题称之为Overdraw。虽然现代的IMR架构GPU在一定程度上可以避免这个问题,但要求应用程序将场景里的三角形按照严格的从前往后的顺序提交给GPU,要完全避免Overdraw还是很困难的。另一方面,由于IMR架构的GPU频繁的读写和修改帧缓存,因此对带宽的要求比较高,同时也增加了电力的消耗。&所以,大部分的移动GPU都采用TBR(Tile Based Rendering)的架构
ARM的Mali GPU和高通的Adreno GPU采用TBR(分块渲染)架构,实际上IMG的PowerVR也是分块渲染的。TBR架构在把三角形场景变成像素图(光栅化)前,先把整个画面分成小块,这些小块的渲染在GPU上的高速缓存里进行,这样就避免了对帧缓存(位于系统内存里)的频繁读写和修改。当然,由于一个三角形可能被分在几个不同的块里,三角形的数据(几何数据)可能被需要多次读取,但总的来说还是能大大减少对系统内存的访问,节约了带宽的同时也减少了电力消耗。
当然,不同的GPU分块的大小也有所不同,PowerVR和Mali一般是16*16像素的块大小,而大部分的高通Adreno都带有256K的缓存,以256K作为块的大小进行渲染,高通称之为binning。但是,除去PowerVR外的TBR GPU同IMR一样,还是不能避免Overdraw的问题。
&而PowerVR的不同之处在于,它采用的TBDR(Tile Based Deferred Rendering)架构,可以彻底避免Overdraw的问题。&相比TBR更进一步的是,TBDR在光栅化之后,有一个HSR(Hidden Surface Removal))硬件单元,通过对一个块内的三角形进行测试,剔除掉被遮挡的三角形,合成一幅由所有可见部分组成的画面,交给后续的流水线去渲染。这样不可见部分就不需要Pixel Shader去做相应的计算,也不需要去拾取相应的纹理,节省了计算量的同时也节省了带宽,对移动设备来说有很大的帮助。
(网友Cain阿斗补充:tbdr技术确实解决了overdraw,问题是也增加了深度检查的耗损,频繁的Z读取,Tiles划分带来的纹理重复拾取, 多边形数量上升之后带来的scene buffer溢出而导致占用了更多的带宽吧,这也似乎是为什么像英伟达这样的老牌gpu厂商不愿意用tbdr技术吧,到最后这种技术严重吃带宽,导致带宽撑爆,得不偿失啊。。。。)
说说被忽略的Shader接下来我们回到Shader。Shader是GPU里负责计算的主要部分,同时占得面积最大,耗电也最多。当今的桌面GPU往往都不再谈三角形生成率,或是像素填充率了,给的指标都是Shader的计算能力——GFLOPS。可见,Shader性能会越来越重要。移动GPU也有着这样的趋势。我们看一下Anandtech测试的各款GPU的GLBenchmark的Egypt HD 1080p Offscreen得分:
(谷歌四儿子过热降频现象严重,成绩不正常)
&右边的绿色数字是该GPU在FP16精度下大致的计算性能,单位为GFLOPS。可以看到除去个别的GPU,Egypt成绩跟Shader计算能力的相关性还是比较明显的。&先做一点铺垫:首先,对于浮点数做一次加法或者乘法,都算是一次操作,记作1 FLOPS。浮点数是有一定的精度的,比如16bit的浮点数,精度就是FP16。再高一点的FP32就是32bit的浮点数,也就是常说的单精度;更高的就是64bit的双精度FP64了。一般来说,只有FP32和FP64的操作才能算是FLOPS。在移动平台的OpenGL ES里,可以指定高、中、低三种不同的精度。对不同的GPU来说,高、中、低精度的实际值略有差别。如下图所示:
对于Adreno和GC系列,无论何种选择何种精度,都会按照FP32精度进行计算。而Mali-400和Tegra的ULP GeForce的Pixel Shader部分不支持高精度,最高只支持中等的FP16精度。绝大部分游戏的Pixel Shader计算都采用中等(FP16)的精度,而Vertex Shader的计算一般是FP32的精度。其次,关于统一渲染架构(Unified Shader)和分离的渲染架构(Discrete Shader)。前者的Shader既能进行Vertex的计算,也能进行Pixel的计算,例如PowerVR,Adreno,GC系列。后者的Vertex Shader和Pixel Shader是分开的,典型的比如Mali-400和ULP GeForce。相对来说,统一渲染架构的Shader利用率会高些,在遇到三角形特别多像素特别少,或者相反的情况下,Shader的计算能力不容易被浪费。
最后,由于顶点坐标(xyzw)和像素颜色(rgba)都具有四个属性,为了提高效率,Shader往往被设计成Vec4的SIMD,也就是可以对四个数据进行打包,然后用一条指令同样的处理。当然如果数据少于四个,计算能力就被浪费了。也有设计成一次只能处理一个数据的标量(scalar)单元。&各家GPU的Shader组成1. 高通Adreno系列
Adreno系列为统一渲染架构,shader ALU为典型的Vec4 + Scalar,Vec4每周期可以处理4个FP32的MAD运算(乘加运算,记为2 FLOPS),Scalar单元不能做MAD,所以,一个Adreno的Shader单元,每周期可提供的浮点操作数为4&2 + 1= 9 FLOPS。主流Adreno GPU运算能力:Adreno 200, 2 Vec4+1, 133MHz,2.4GFLOPSAdreno 205, 4 Vec4+1, 266MHz,9.5GFLOPS Adreno 220, 8 Vec4+1, 266MHz,19.1GFLOPS Adreno 225, 8 Vec4+1, 400MHz,28.8GFLOPS Adreno 320, 如果是16Vec4+1, 跑400MHz的话,就是57GFLOPS以上都是FP32的计算能力,由于OPENGL ES里,高中低精度Adreno都是按照FP32跑,因此在低精度的情况下,也不能获得性能提升。&2. PowerVR SGX系列
2.1 旧的SGX5系列包括SGX530/531/535/540/545,其Shader计算单元为USSE。USSE一个周期,可以对4个FX10(10bit的定点数,比FP16精度更低) 或者 2个FP16 或者 1个FP32 进行MADD操作。由于FP32才算是正常意义上的FLOPS,所以其性能每周期2 FLOPS。但是当两个FP32的操作共享一个操作数时,USSE也可以在一个周期里处理,此时就是2个FP32的MAD操作,4 FLOPS。所以,USSE的FP32性能,每周期为2~4 FLOPS。主流SGX5 GPU运算能力:
SGX530, 2USSE,200MHz,0.8~1.6 GFLOPSMTK的SGX531,2USSE,300MHz,2USSE,1.2~2.4 GFLOPS三星蜂鸟SGX540,4USSE,200MHz,1.6~3.2 GFLOPSOMAP4460,ATOM Z2460的SGX540 400MHz, 4USSE,3.2~6.4 GFLOPS不过在FP16下,也就是大多数游戏的Pixel Shader精度下,相比FP32的最差情况下就能翻倍了。同样在更低精度的FX10下,还能再翻倍。&2.2 SGX 5XT系列包括SGX543/544/554,和它们的各种多核版本。其Shader计算单元为USSE2。USSE2不像之前那样了,是个Vec4+scalar的架构,单周期支持4个FP32的MAD操作,外加一个简单的scalar操作(ADD/MUL),这样跟Adreno一样,每周期 9 FLOPS。单个543/544包含4个USSE2,性能基本一样,544多一些DX的API支持。单个554则包含8个USSE2。主流SGX5XT GPU运算能力:iPhone 4S里的543MP2,2&4=8个USSE2,200MHz,14.4 GFLOPSOMAP4470里的单个544,384MHz,4USSE2,跟上面类似全志A31里的544MP2,所谓的8管线就是8USSE2,300MHz,也有21.6 GFLOPSiPad3里的A5X,543MP4,16USSE2,250MHz,36 GFLOPSiPad4的A6X,554MP4,32USSE2,280MHz,就突破80 GFLOPS了在运算较低精度的FP16时,USSE2的性能还能有一定的提升。&3. ARM Mali系列
3.1 Mali-400Mali-400并非Unified Shader,是顶点和像素处理分开的一个顶点处理器包含一个Vertex Shader ,Vec4,支持FP32精度一个像素处理器包含一个Vec4的Pixel Shader,以及一个TMU, Shader支持FP16精度主流Mali GPU运算能力:一个Mali-400“单核”,400MHz下,计算能力为6.4 GFLOPSExynos 4210的Mali-400 MP4,266MHz,则为10.6 GFLOPSGalaxy S3的Mali-400 MP4, 440MHz,则为17.6 GFLOPSNote2的Mali-400 MP4,运行在533MHz,则为21 GFLOPS当然这些都是FP16…… 因为Mali-400的Pixel Shader不支持FP32精度。&3.2 Mali-T6xx系列T6xx采用新架构,Shader为统一渲染架构。其中T604/624/628 ,一个核心含有2个ALU,而T658/678,为强化计算型,一个core含有4个ALU。&每个ALU是个128bit wide的Vector Unit加上一个32bit的Scalar单元组成。
所以,单精度(FP32)性能为每周期9个,同USSE2。那么Exynos MHz的Mali-T604 四核,FP32的计算能力为 38.4 GFLOPS同样,因为游戏里用的多的Pixel Shader是FP16精度,而T604的VU ALU此时处理能力能翻倍变成8个,这样每周期就是8*2 + 1 =17个。符合ARM宣称的500MHz下单个T604核心17GFLOPS,四核心68GFLOPS的数据。那么Exynos MHz的Mali-T604 四核,FP16的计算能力为 72.5 GFLOPS&4. GeForce ULPGeForce ULP同Mali-400,是分离的Shader架构。其Vertex Shader和Pixel Shader都是Scalar的,并非Vec4。顶点支持FP32精度,像素部分支持FP20和FX10精度。所以,“8核”Tegra 2, 4VS + 4PS,300MHz,计算能力为4.8 GFLOPS“12核”Terga3,4VS + 8PS,520MHz,计算能力为12.5 GFLOPS
(由此看出老黄还是主打成本,架构仅相当于桌面市场04-05年的Geforce 6、7系,据说下一代tegra4会上kepler架构?)&5. Vivante的GC系列跟Adreno差不多,也是Vec4 +1的结构,同样高中低精度都按照FP32计算,低精度下不会有提升。RK29的GC800, 1Vec4+1, 450MHz,4 GFLOPS飞思卡尔i.MX6的GC2000, 4Vec4+1,600MHz,21.6 GFLOPS海思K3V2的GC4000,8Vec4+1,480MHz,34.6 GFLOPS
(由此看出华为海思4核的GPU理论性能不弱,但实际游戏表现却往往受制于兼容性)
&GPU“兼容性”现在还有个经常被提到的是GPU的“兼容性”问题,这里就要涉及到各个GPU支持的纹理格式了。首先是ETC1,这个是OPENGL ES 2.0支持的纹理格式,大家都得支持。但这个纹理的一个缺点是不支持alpha通道,所以对于有alpha通道的纹理,就要拆成2个纹理去读取,效率低,浪费了带宽。而PVRTC是PowerVR自家的纹理格式,同样ATITC是高通Adreno的纹理格式,此外S3TC就是桌面很常见的DXT,微软DirectX 3D的纹理格式,这些都是支持alpha通道的。PowerVR GPU支持自家的PVRTC和通用的ETC1(iOS下的PVR GPU只支持PVRTC),Adreno支持自家的ATITC和通用的ETC1,NV的GeForce和Vivante的GC系列支持DXT和ETC1,剩下Mali-400只支持ETC1。所以,对应不同的GPU,会有不同的游戏数据包。通用数据包,一般都会采用ETC1,虽然通用,但由于不支持alpha通道要贴图2次,对于非Mali的GPU其实都算是吃亏了。如果用自己支持的其他格式,就不用受这个苦了。对于贴图单元(TMU,Texture Mapping Unit)数目相对较少的Adreno 2xx系列,恐怕更是吃亏。当然,纹理的支持度只是兼容性的一方面,并不是兼容性问题的全部。
&各家的“多核”GPU硬件的部分基本说完了,这里总结一个表格,同时给出了GPU厂商官方定义的一个“核”的内容,谁的核里料多,谁比较不厚道,应该也是一目了然了吧。面对各种“16核”“8管线”的宣传,大家也应该能比较清楚的辨别了吧。&跑分跟实际表现不一样?优化很重要!最后,规格只是GPU的一个方面,实际表现跟架构也有很大的关系。更进一步的,就算是Benchmark中跑分差不多的GPU,在不同的游戏中,实际表现也会有差别。首先,Benchmark程序,大部分都是公平的,所以本质上,Benchmark都是“零优化”程序,公平起见,他们的纹理会用RGBA的PNG,TGA,或者ETC1纹理,不会用到各个GPU自家的格式。但是游戏不一样,游戏可以做相应的优化。例如PVR的GPU,可以用4bpp甚至2bpp的PVRTC纹理,相比于未压缩的贴图就可以节省8倍甚至16倍的带宽。而没有被优化到的情况下,可能只能跟着Mali用不支持alpha通道的ETC1,做2次贴图,浪费带宽。部分厂商甚至在通用数据包里放了一些未压缩贴图,那差距就更大了。同款游戏,跑分接近的GPU,iOS上的特效更好,流畅度更佳,就有优化的原因。其次,Benchmark在一定程度上都是相对超前的。大部分GPU跑Benchmark的帧率,都不会到流畅的级别(要是满帧了还怎么测出区别)。早期的Benchmark可能更加侧重贴图和像素部分。新一代的Benchmark则提升了场景复杂度,对多边形和Shader计算的压力进一步增大,例如GLBenchmark 从2.1到2.5的提升。因此,一些三角形生成能力和原生Shader计算能力高的GPU,比如Adreno 220/225,得分提升就会比较明显。而Mali-400则在2.5中遇到三角形生成的瓶颈,得分表现不如之前。而游戏是给人玩的,终端厂商或是SOC厂商可以跟游戏厂商合作,针对GPU的特点进行相应的优化。不同GPU侧重很不一样,比如Mali-400,三角形很弱,像素部分,填充率强。高通Adreno 2xx,Vivante的GPU,多边形很强,Shader计算强,但填充率较弱。如果场景对Mali优化,游戏商可以减少画面中多边形的量,用贴图和像素部分实现更多的特效。这样对Adreno 2xx系列不利。如果对Adreno优化,则可以增加场景复杂度,用更多的三角形进行更精细的建模,但这样对Mali则不利。这只是一方面,在一些细节上,还可以进行更深层次的优化,各家的GPU也都会提供相应的工具。
最后,GPU的跑分在一定程度上能反映GPU的实际性能,但最终在游戏中的表现还是很看厂商优化的。所以也不要一味的盯着跑分,多问问玩过的朋友,多看看实测,会更有帮助。
补充:关于简介里的问题……
为何小米2的Adreno跑分非常高MC4却默认不开全特效?为何华为自家4核处理器K3V2所用的GPU GC4000性能不弱却经常遇到游戏闪退黑屏,没有数据包?为何以前有人说和苹果同样采用sgx系列GPU的芯片往往有&神油&(游戏性能比跑分更出色)?为何三星猎户座刚用mali400mp4的时候经常因兼容性被黑,现在却大为改善?
我个人看法是:游戏厂商为ios做了优化,移植到安卓上的时候,gpu相似的芯片就占了优势……
三星一开始没塞钱,现在下了血本后厂商也开始为它优化了……
高通对厂商的游戏优化不上心……
至于冷门厂商Vivante的GC系列,虽然纸面参数漂亮,可惜也就国产芯会用它了……
移动GPU全解读,手机平板跑大型游戏该用什么GPU?该投稿暂无简介本文可以解释以下问题:为何小米2的Adreno跑分非常高MC4却默认不开全特效?为何华为自家4核处理器K3V2所用的GPU&GC4000性能不弱却经常遇到游戏闪退黑屏,没有数据包?为何以前有人说和苹果同样采用sgx系列GPU的芯片往往有&神油&(游戏性能比跑分更出色)?为何三星猎户座刚用mali400mp4的时候经常因兼容性被黑,现在却大为改善?本文可以解释以下问题:为何小米2的Adreno跑分非常高MC4却默认不开全特效?为何华为自家4核处理器K3V2所用的GPU&GC4000性能不弱却经常遇到游戏闪退黑屏,没有数据包?为何以前有人说和苹果同样采用sgx系列GPU的芯片往往有&神油&(游戏性能比跑分更出色)?为何三星猎户座刚用mali400mp4的时候经常因兼容性被黑,现在却大为改善?[+展开简介]投1蕉安利给基友官方下载友情链接反馈本站不提供任何视听上传服务,所有内容均来自视频分享站点所提供的公开引用资源。Copyright (C)
AcFun. 保留所有权利

我要回帖

更多关于 跑江湖平板拖把讲口词 的文章

 

随机推荐