GPU系统工程师是做什么的的

【GPU工程师招聘网_GPU工程师招聘信息】 - 智联招聘
您的浏览器不支持JavaScript,请使用其它浏览器
选择单个城市,才能查看地铁/地标信息,不信你试试~
选择单个城市,才能查看地铁/地标信息,不信你试试~
请在UC浏览器设置中关闭智能云加速功能,否则将无法投递简历。具体步骤:点击设置—极速省流—智能云加速
1.5万-3万/月
上海青凤致远地球物理地质勘探科技有限公司
&2017 zhaopin.com 智联在手,工作我有
北京网聘咨询有限公司华为工程师透露GPU正在研发中-IT与通讯技术-超级大本营军事论坛-最具影响力军事论坛 -
后使用快捷导航没有帐号?
只需一步,快速开始
查看: 29606|回复: 54
华为工程师透露GPU正在研发中
更多精彩专业军事内容,期待你的加入!
才可以下载或查看,没有帐号?
本帖最后由 EKW 于
17:58 编辑
(14.72 KB, 下载次数: 31)
17:21 上传
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
GPU, 手机OS。&&交给别人研究,还真不看好。
华为吗? 估计成功概率至少85%。谨慎适度看好。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
头像被屏蔽
GPU其实只要海思的U能外销 销量大 软件厂商的优化倒是不成问题 OS的确难推广
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
前几年还说要自己搞手机操作系统的
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
可信度几层?
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
祝贺,可以像麒麟一样,慢慢走向稳定成功
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
mips64el 发表于
可信度几层?
让时间来见证吧!
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
别的都好说,这手机OS么,呵呵了。
这事不是华为多努力就能成功的,甚至可以说,几乎没有成功的希望。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
别的都好说,这手机OS么,呵呵了。
这事不是华为多努力就能成功的,甚至可以说,几乎没有成功的希望。
兼容安卓就行。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
兼容安卓就行。
说句粗话,那叫脱裤子放屁,还不如直接用安卓呢。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
involute 发表于
说句粗话,那叫脱裤子放屁,还不如直接用安卓呢。
万一谷歌哪一天不开源呢?乖乖的交费?谷歌说多少就是多少吗?手里有备用的货,心头才不慌。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
本帖最后由 involute 于
22:05 编辑
万一谷歌哪一天不开源呢?乖乖的交费?谷歌说多少就是多少吗?手里有备用的货,心头才不慌。
谷歌不开源也只是未来的版本不开源,你仍旧可以在现有的版本上发展出另一套系统来。比如UNIX-&BSD-&FreeBSD-&iOS。
手里有备用的货,也得看这备用的货和乖乖花钱买回来的货哪个更能得到商业上的成功。
说来说去,华为不照样用ARM?不怕哪天ARM不给华为授权了?也没见华为自己另起炉灶搞一套出来啊,不是华为没能力,而是华为知道几乎无法获得商业上的成功。
简单说,你要吃饭,尽管超市里的大米是收费的,你会自己去种稻子么?米价翻一倍,你就会去种稻子了?仍旧不会吧。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
involute 发表于
说句粗话,那叫脱裤子放屁,还不如直接用安卓呢。
如果谷歌关闭安卓的授权怎么办呢?一个几百亿美元的公司自然会考虑产业安全,不会心存幻想。正如任正非说的,一旦安卓闭源,要能立刻拿出替换的系统,平时可以不用,但研发不能停,12年到现在一直在弄。
其它的公司如三星的bada和tizen系统,亚马逊的系统包括阿里的yunos都好好的在开发使用,兼容安卓,没人觉得是多此一举。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
involute 发表于
谷歌不开源也只是未来的版本不开源,你仍旧可以在现有的版本上发展出另一套系统来。比如UNIX-&BSD-&Fre ...
这能跟超市卖大米比吗?等谷歌不开源,你自己才开始开发系统,会落后多久?三星还自己搞bada呢。预研操作系统的投入可以不高,但不能是0。不然连个砍价的工具都没。还有你说的arm的问题,高通的旗舰一直是用自己的架构(810除外)。三星明年也要上自己的架构。华为海思也在向这个方向努力。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
本帖最后由 involute 于
22:33 编辑
如果谷歌关闭安卓的授权怎么办呢?一个几百亿美元的公司自然会考虑产业安全,不会心存幻想。正如任正非说 ...
呵呵呵,bada和tizen好好的?说什么梦话呢。
谷歌关闭授权,你不会在现有开源的系统上拿出一套自己的定制版啊?还用问怎么办?
兼容安卓,兼容安卓每一个freamwork,兼容安卓的每一个API?说得容易,那到底是安卓在开发还是你在开发?
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
本帖最后由 involute 于
22:35 编辑
这能跟超市卖大米比吗?等谷歌不开源,你自己才开始开发系统,会落后多久?三星还自己搞bada呢。预研操 ...
“才”,逗。
难道现在华为在开源安卓基础上的工作,不是开发?什么叫才?什么叫落后?你倒是说说,假如明天安卓新版本就不开源了,华为的定制安卓,落后多久?
说到ARM,所谓自己架构,难道不需要ARM的授权?我问的是ARM不给你授权了怎么办?用龙芯去嘛?
真有一天,安卓闭源并且收费,华为的选择照样是“乖乖交钱”,否则就是个死。到那一天,可没有安卓让你“兼容”了。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
involute 发表于
“才”,逗。
难道现在华为在开源安卓基础上的工作,不是开发?什么叫才?什么叫落后?你倒是说说, ...
保守估计会落后一年。
arm架构和指令集每年都有干货出来。授权也不贵。所以几家掏钱都心甘情愿。arm如果没落了,你看还这么爽快不。
安卓如果要收钱,也得看时机。真有这么简单,谷歌不收是傻子。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
保守估计会落后一年。
arm架构和指令集每年都有干货出来。授权也不贵。所以几家掏钱都心甘情愿。arm如果 ...
逗吗你?假如有一天安卓忽然闭源了。你拿出自己研发的操作系统,之前不公开freamwork,不公开api,没有一个第三方软件。这样的操作系统拿出来,你告诉我又落后多久?呵呵了。
操作系统这玩意,拉几个博士就能写一个,有个老外甚至花了5年自己单人写了套操作系统,还顺便创造了门语言和一个编译器。问题是操作系统是生态系统的代名词,你忽然拿出自己的系统来,生态哪来?不死,怎么活得下去?
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
involute 发表于
逗吗你?假如有一天安卓忽然闭源了。你拿出自己研发的操作系统,之前不公开freamwork,不公开api,没有 ...
兼容安卓应用
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
兼容安卓应用
不开源了还会让你兼容?逗呢吧?能兼容的话,怎么不兼容iOS?切。
兼容也是兼容旧版本,“兼容旧安卓”和“本来就是旧安卓”,到底有啥去别,你告诉我呗。让我说,区别就是后者不需要脱裤子放屁。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
既然是做生意,那就是共同赚钱的,担心google关闭andriod授权,要收费,也不是坏事,大家来谈,这个钱怎么收
google也不是慈善家,商业公司都不是慈善家
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
involute 发表于
不开源了还会让你兼容?逗呢吧?能兼容的话,怎么不兼容iOS?切。
兼容也是兼容旧版本,“兼容旧安卓 ...
安卓一年一个大版本,所以是落后一年。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
安卓一年一个大版本,所以是落后一年。
我问你的是,人家不开源了,你还怎么兼容?还不是只能兼容一年前的老版本,还不是只能“落后一年”,既然如此,自己开发操作系统再兼容安卓的意义在哪?
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
兼容安卓就行。
那样和阿里云什么区别?
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
如果谷歌关闭安卓的授权怎么办呢?一个几百亿美元的公司自然会考虑产业安全,不会心存幻想。正如任正非说 ...
那为什么国内不直接使用阿里云?统一平台更好。
如果真要做aliyun那样的,阿里之前做了一个,然后华为做一个,小米、中兴不甘落后,又自己做自己的。何时了。好像现在国内linux现状。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
involute 发表于
我问你的是,人家不开源了,你还怎么兼容?还不是只能兼容一年前的老版本,还不是只能“落后一年”,既然 ...
过渡,尽快形成生态。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
本帖最后由 焚寂古剑 于
23:46 编辑
安卓系统有很多先天缺陷,能被大多数手机采用就是因为它开源和免费
安卓来源于Linux,如果有一天安卓关起门来自己过,各大软硬件开发商就会毫不犹豫的转头去抱Linux大腿。
在手机和移动市场谷歌好像还没有这么大的号召力,至少在世界最大的手机市场中国它还没有。。。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
过渡,尽快形成生态。
又逗是不是?用现有版本安卓不能过渡?非要自己开发操作系统完成过渡?
尽快形成生态?怎么个尽快?准备花几个“一年”?你有多大影响力让第三方厂商为你尽快?windows mobile花了这么多年也没“尽快”成,你上下嘴皮子一碰,就尽快了?
说来说去,照你说,什么兼容安卓,都是没用的废话,还是要形成自己的生态。问题是,你去问问微软,自己的生态那么好形成的?这就是我说的几乎没有成功的希望的原因,当然,我说成功是指商业上的成功。
这个“尽快”的几年时间,到底要丢掉多少市场,跟交给谷歌的授权费,孰重孰轻,余承东掰脚趾头也算得清吧。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
为什么先是gpu而不是自主架构的核心?
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
involute 发表于
谷歌不开源也只是未来的版本不开源,你仍旧可以在现有的版本上发展出另一套系统来。比如UNIX-&BSD-&Fre ...
不是已经有新闻说华为已经开始研发自己的架构了吗?只不过新闻里说华为打算把研发的新架构用于服务器
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
为什么先是gpu而不是自主架构的核心?
后者是绝密项目不能说
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
海思半导体是三大芯片软件商(新思,馒头,刊登司)的大客户,也是菊花集团千亿美元目标的重要推动力
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
involute 发表于
又逗是不是?用现有版本安卓不能过渡?非要自己开发操作系统完成过渡?
尽快形成生态?怎么个尽快?准 ...
因为微软拉不下脸山寨安卓
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
那为什么国内不直接使用阿里云?统一平台更好。
如果真要做aliyun那样的,阿里之前做了一个,然后华为做 ...
直接使用阿里云那和现在使用安卓有什么区别?这两个系统一个是美国公司一个是日本公司。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
那为什么国内不直接使用阿里云?统一平台更好。
如果真要做aliyun那样的,阿里之前做了一个,然后华为做 ...
不是阿里云,是YunOS。
菊花、剁手做的手机操作系统,我认为就是YunOS类型,在Linux核心基础上自己实现应用层和虚拟机,兼容安卓框架。
假如安卓闭源(可能性接近零),国家多半要出面,联合各厂商弄一个手机操作系统联盟。技术基础已经很扎实了,根本不怕Google掣肘。YunOS作为最完备的自主系统,很有机会。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
壮东风 发表于
不是阿里云,是YunOS。
菊花、剁手做的手机操作系统,我认为就是YunOS类型,在Linux核心基础上自己实现 ...
谢谢指正,我之前都一直叫他阿里云。。看来弄错了。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
因为微软拉不下脸山寨安卓
说来说去还是兼容安卓嘛,问题是楼上不是说怕安卓闭源不让兼容了嘛,你怎么办呢。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
xenodragon 发表于
因为微软拉不下脸山寨安卓
微软内置安卓模拟器,原生兼容安卓,只不过发布前临时取消了,现在网上还有下载。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
involute 发表于
说来说去还是兼容安卓嘛,问题是楼上不是说怕安卓闭源不让兼容了嘛,你怎么办呢。
闭源只是不再开源了,不能再用安卓系统了,但是安卓上的第三方软件才是最大的财富,安卓的基础本来就是开源软件,跟谷歌无关,只要绕过谷歌的中间层和虚拟机就好了。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
mips64el 发表于
可信度几层?
假的~~~~~~~~
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
声明:论坛言论仅代表网友个人观点,不代表超级大本营军事网站立场
Powered by Discuz &
超级大本营军事网站
(违法及不良信息举报电话:)
最具影响力中文军事论坛 - Most Influential Chinese Military Forum工程师应烂熟于心的GPU与CPU的性能对比
CPU和GPU之所以大不相同,是由于其设计目标的不同,它们分别针对了两种不同的应用场景。CPU需要很强的通用性来处理各种不同的数据类型,同时又要逻辑判断,还会引入大量的分支跳转和中断的处理。这些都使得CPU的内部结构异常复杂,而GPU面对的则是类型高度统一的、相互无依赖的大规模数据和不需要被打断的纯净的计算环境。
这个视频,非常具象的表述了CPU和GPU在图像处理时的不同的原理和方法。看到GPU的模型喷射出的一瞬间,你就秒懂了。
根据上面视频中的比喻,你应该很清楚CPU和GPU就呈现出非常不同的架构:
绿色的是计算单元
橙红色的是存储单元
橙黄色的是控制单元
GPU采用了数量众多的计算单元和超长的流水线,但只有非常简单的控制逻辑并省去了Cache。而CPU不仅被Cache占据了大量空间,而且还有有复杂的控制逻辑和诸多优化电路,相比之下计算能力只是CPU很小的一部分。
GPU 如何加快软件应用程序的运行速度GPU 加速计算可以提供非凡的应用程序性能,能将应用程序计算密集部分的工作负载转移到 GPU,同时仍由 CPU 运行其余程序代码。从用户的角度来看,应用程序的运行速度明显加快。
GPU 与 CPU 性能比较理解 GPU 和 CPU 之间区别的一种简单方式是比较它们如何处理任务。CPU 由专为顺序串行处理而优化的几个核心组成,而 GPU 则拥有一个由数以千计的更小、更高效的核心(专为同时处理多重任务而设计)组成的大规模并行计算架构。
从上图可以看出:
Cache, local memory: CPU & GPU
Threads(线程数): GPU & CPU
Registers: GPU & CPU
SIMD Unit(单指令多数据流,以同步方式,在同一时间内执行同一条指令): GPU & CPU
CPU 基于低延时的设计
CPU有强大的ALU(算术运算单元),它可以在很少的时钟周期内完成算术计算。
当今的CPU可以达到64bit 双精度。执行双精度浮点源算的加法和乘法只需要1~3个时钟周期。
CPU的时钟周期的频率是非常高的,达到1.532~3gigahertz(千兆HZ, 10的9次方)。
大的缓存也可以降低延时。保存很多的数据放在缓存里面,当需要访问的这些数据,只要在之前访问过的,如今直接在缓存里面取即可。
复杂的逻辑控制单元。当程序含有多个分支的时候,它通过提供分支预测的能力来降低延时。
数据转发。 当一些指令依赖前面的指令结果时,数据转发的逻辑控制单元决定这些指令在pipeline中的位置并且尽可能快的转发一个指令的结果给后续的指令。这些动作需要很多的对比电路单元和转发电路单元。
GPU是基于大的吞吐量设计
GPU的特点是有很多的ALU和很少的cache。缓存的目的不是保存后面需要访问的数据的,这点和CPU不同,而是为thread提高服务的。如果有很多线程需要访问同一个相同的数据,缓存会合并这些访问,然后再去访问dram(因为需要访问的数据保存在dram中而不是cache里面),获取数据后cache会转发这个数据给对应的线程,这个时候是数据转发的角色。但是由于需要访问dram,自然会带来延时的问题。
GPU的控制单元(左边黄色区域块)可以把多个的访问合并成少的访问。
GPU虽然有dram延时,却有非常多的ALU和非常多的thread。 为平衡内存延时的问题,我们可以充分利用多的ALU的特性达到一个非常大的吞吐量的效果。尽可能多的分配多的Threads。通常来看GPU ALU会有非常重的pipeline就是因为这样。
所以与CPU擅长逻辑控制,串行的运算。和通用类型数据运算不同,GPU擅长的是大规模并发计算,这也正是密码破解等所需要的。所以GPU除了图像处理,也越来越多的参与到计算当中来。
GPU的工作大部分就是这样,计算量大,但没什么技术含量,而且要重复很多很多次。就像你有个工作需要算几亿次一百以内加减乘除一样,最好的办法就是雇上几十个小学生一起算,一人算一部分,反正这些计算也没什么技术含量,纯粹体力活而已。而CPU就像老教授,积分微分都会算,就是工资高,一个老教授资顶二十个小学生,你要是富士康你雇哪个?
GPU就是这样,用很多简单的计算单元去完成大量的计算任务,纯粹的人海战术。这种策略基于一个前提,就是小学生A和小学生B的工作没有什么依赖性,是互相独立的。很多涉及到大量计算的问题基本都有这种特性,比如你说的破解密码,挖矿和很多图形学的计算。这些计算可以分解为多个相同的简单小任务,每个任务就可以分给一个小学生去做。但还有一些任务涉及到“流”的问题。比如你去相亲,双方看着顺眼才能继续发展。总不能你这边还没见面呢,那边找人把证都给领了。这种比较复杂的问题都是CPU来做的。
总而言之,CPU和GPU因为最初用来处理的任务就不同,所以设计上有不小的区别。而某些任务和GPU最初用来解决的问题比较相似,所以用GPU来算了。GPU的运算速度取决于雇了多少小学生,CPU的运算速度取决于请了多么厉害的教授。教授处理复杂任务的能力是碾压小学生的,但是对于没那么复杂的任务,还是顶不住人多。当然现在的GPU也能做一些稍微复杂的工作了,相当于升级成初中生高中生的水平。但还需要CPU来把数据喂到嘴边才能开始干活,究竟还是靠CPU来管的。
什么类型的程序适合在GPU上运行?
(1)计算密集型的程序。所谓计算密集型(Compute-intensive)的程序,就是其大部分运行时间花在了寄存器运算上,寄存器的速度和处理器的速度相当,从寄存器读写数据几乎没有延时。可以做一下对比,读内存的延迟大概是几百个时钟周期;读硬盘的速度就不说了,即便是SSD, 也实在是太慢了。
(2)易于并行的程序。GPU其实是一种SIMD(Single Instruction Multiple Data)架构, 他有成百上千个核,每一个核在同一时间最好能做同样的事情。
CPU会利用较高的主频、cache、分支预测等技术,使处理每条指令所需的时间尽可能少,从而减低具有复杂跳转分支程序执行所需的时间。GPU则通过数量丧心病狂的流处理器实现大量线程并行,使同时走一条指令的数据变多,从而提高数据的吞吐量。
举个GPU通用计算教材上比较常见的例子,一个向量相加的程序,你可以让CPU跑一个循环,每个循环对一个分量做加法,也可以让GPU同时开大量线程,每个并行的线程对应一个分量的相加。CPU跑循环的时候每条指令所需时间一般低于GPU,但GPU因为可以开大量的线程并行地跑,具有SIMD(准确地说是SIMT)的优势。
再以挖BIT币举例
比特币的挖矿和节点软件是基于P2P网络、数字签名、密码学证据来发起和验证交易的。节点向网络广播交易,这些广播出来的交易在经过矿工的验证后,矿工用自己的工作证明结果来表达确认,确认后的交易会被打包到数据块中,数据块会串起来形成连续的数据块链。
每一个比特币的节点都会收集所有尚未确认的交易,并将其归集到一个数据块中,这个数据块会和前面一个数据块集成在一起。矿工节点会附加一个随机调整数,并计算前一个数据块的SHA-256哈希运算值。挖矿节点不断重复进行尝试,直到它找到的随机调整数使得产生的哈希值低于某个特定的目标。
如果希望判定一个人提供的信息是本着正常使用,具备一定价值的。那么我们倾向认为提供这个信息的人,愿意为此付出一定工作量来证明他的诚实。假如有一种机制,能够容易的证明提供信息的人为此付出了一定工作量,那么此信息是可以接受,并被认为合理的。
比如,我收邮件的时候,做了一个规定:“把邮件内容数据,加入一个随机数,求一个sha256散列数值。这个散列值一共256bit 。前20bit 必须都为0”.
这样,要给我发信的人,就必须反复尝试一个随机数,以保证邮件内容数据加上这个随机数,能够产生sha256 的结果------前20bit 都是0。(这个计算过程本身毫无意义)。如何产生出指定要求的整数?完全靠运气和CPU 运算时间。这就是一个工作量。工作本身毫无意义。但是如果谁愿意付出这个工作量,就意味着他给我的邮件多半是有意义的。这就叫“工作量证明”。也就是意味着这个人很有可能是诚实的。这里把邮件换成Block也是等效的。这个机制被广泛用于防止垃圾邮件等。因为群发垃圾邮件的人,不可能有那么多时间去给每个人算一个毫无意义的数字,浪费时间,降低发垃圾邮件的效率。挖矿的目的是确认交易。寻找随机数的过程是为了保证每一个挖矿节点不会往外发送垃圾block。发送的BlockId是这个Block的Hash,它必然是首20bit为0的。
可以预见的是对于比特币的Hash计算而言,它几乎都是独立并发的整数计算,GPU简直就是为了这个而设计生产出来的。相比较CPU可怜的2-8线程和长度惊人的控制判断和调度分支,GPU可以轻易的进行数百个线程的整数计算并发(无需任何判断的无脑暴力破解乃是A卡的强项)。
OpenCL可以利用GPU在片的大量unified shader都可以用来作为整数计算的资源。而A卡的shader(流处理器)资源又是N的数倍(同等级别的卡)。
比特币早期通过CPU来获取,而随着GPU通用计算的优势不断显现以及GPU速度的不断发展,矿工们逐渐开始使用GPU取代CPU进行挖矿。前面我们已经介绍,比特币挖矿采用的是SHA-256哈希值运算,这种算法会进行大量的32位整数循环右移运算。有趣的是,这种算法操作在AMD GPU里可以通过单一硬件指令实现,而在NVIDIA GPU里则需要三次硬件指令来模拟,仅这一条就为AMD GPU带来额外的1.7倍的运算效率优势。凭借这种优势,AMD GPU因此深受广大矿工青睐。
现在你知道为什么AMD搞得跟蓝翔技校似得了吧?
免责声明:本文系网络转载,版权归原作者所有。如涉及作品版权问题,请与我们联系,我们将根据您提供的版权证明材料确认版权并支付稿酬或者删除内容。
责任编辑:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
今日搜狐热点|0微博Qzone微信资深工程师解读5个被误解的CPU/GPU概念  从英特尔1971年推出第一款商用微处理器4004到现在,处理器已经走过了三十多年的历程,目前,CPU处理器已经从服务器、PC发展到嵌入式、工控、消费、医疗等各个领域,但是从总体架构上来看,CPU的架构并没有太大改善,不过也有一些新的架构突破,作为一个一直跟CPU打交道的工程师,感觉很多人被一些概念误导,这里谈谈5个被误解的CPUGPU概念。  1、 多核与多线程  提起多核与多线程,很多人首先会想到手机中的多核大战,而忘记了多线程技术,从单核到双核到四核再到8核,似乎多核才是处理器发展的王道,但是大家想过没有?为什么到了8核之后多核之战就打住了呢?多线程技术到底有没有优势?  其实多核有个的缺陷就是随着内核数量的提升,性能的提升并不跟核数增加成正比,按照阿姆达定律:一个程序存在两部分,只能串行计算的部分S,和能够并行计算地部分P。两部分之和是整个程序,因此S+P=1。这个程序如果在一个具有N个核心的处理器上运行,那么和它在一个单核处理器上运行相比,速度的提升是1/(S + P/N)。当N趋近于无穷大时(即假设我们有无穷多个核心),速度提升的上限是1/S,即速度提升的上限取决于程序不能被并行计算的部分。  这个定律的结果就是,即便我们能够有效地并行计算一个程序的 95%,剩下 5% 只能串行计算的部分限制了这个程序的运行速度最多能提升 1/5%=20 倍。而现有的程序中很少能够做到 95% 以上部分的并行计算。这张图显示了对于4种不同类型的程序(分别有50%,75%,90%,95%的部分能够并行处理)的速度提升相对于处理器核心数量的关系,纵轴是相对于单核处理器速度提升的倍数,横轴是处理器核心的数量。可以看到4条曲线随着处理器核心数量的增加逐渐趋于平坦。    现在的多核处理器还远远没到拥有 1,000 个核心的时候。然而未来的某一天,不管是软件还是硬件工程师们也许会满头大汗地向客户解释这个问题:为什么最新的 1,000 核处理器比旧的 100 核处理器快不了多少?  所以多核的发展路子是有局限的,再来看看多线程技术,多线程(英语:multithreading),是指从软件或者硬件上实现多个线程并发执行的技术。具有多线程能力的计算机因有硬件支持而能够在同一时间执行多于一个线程,进而提升整体处理性能。其实这个技术是非常好的,现在英特尔在PC处理器领域基本是走的多线程的路子。它最新的CPU都是四核8线程。  多线程技术可以在不显著增加功耗和面积的条件下提供性能的稳定增加,举例来说,双核和单核双线程,每增加一个线程有50%稳定线性增加,但是对于多核来说,双核比单核有50%提升,但是三核只有30%提升,而四核只有20%的提升了。  而且从开发难度来说,多线程开发难度要弱于多核,多核是需要大量人工优化的,后期需要芯片厂商和系统厂商投入大量的人力物力,而得益于英特尔的普及,软件系统对多线程的支持已经很成熟了,Linux早就支持多线程了,而且多线程开发是CPU自动分派任务不用人工参与,这样可以提升开发效率。  所以,未来CPU的发展除了从32位升级到64位,在多核多线程的应用上不应该割裂开,多核多线程可以提升CPU的能效,解决性能和功耗的矛盾。&  2、MIPS CPU内核与ARM CPU内核  现在ARM处理器名气很大,很多人认为一定是ARM CPU内核强于MIPS CPU内核,其实这是个错误认识,有时商业选择中技术因素并不是主导因素,往往其他因素才是主导因素。  在2000年前后,MIPS处理器在中国的名声也是非常大,毕竟它是RISC处理器架构的发明者,但是,ARM处理器在2000年初进入中国后,通过生态系统打败了MIPS内核。当时把ARM带入中国的谭军博士在高校推广ARM处理器,开发很多教程,还到处举办培训和讲座,另外,针对中国IC设计公司缺乏设计能力的现状,ARM推出了针对中国IC半导体公司的授权策略和硬核模式,大大降低了CPU的开发难度。  以前,CPU设计都是高高在上皇冠上的明珠,ARM把CPU设计变成了搭积木时的设计,大量中国半导体IC设计公司采用了ARM内核,而且ARM也构建了比较好的生态系统,借助手机大发展起来。而MIPS当时在中国的生态系统做的不够好,也不调整自己的授权模式,因此败北是必然的。  不过,自从MIPS被Imagination收购后,反而有了大发展,我分析一个原因是Imagination强化了生态系统建设,例如和包括博通、Cavium、Ikanos、Ineda Systems、Ingenic Semiconductor、Lantiq、Nevales Networks、PMC和高通等共同成立prpl基金会。这也是强化生态系统的节奏,而且有很多大牌公司加入。  Imagination除了强大的GPU外,还提供CPU,ISP、VPU、zigbee蓝牙wifi,4G LTE等多种内核,而且提供了针对物联网,云计算的IP产品,可以算是提供最全IP的公司,MIPS内核一直以低功耗著称,随着生态系统构建好,未来物联网大爆发,Imagination机会很多啊。  3、 安全性谁家强?  自从&棱镜门&曝光后,安全已经成为移动通信设备和其他便携式电子设备最关注的焦点,如何提升设备的安全防护水准?显然,从芯片就开始提供设备的安全防护是最有效的举措。ARM公司于2003年提在嵌入式领域出了TrustZone技术,为硬件系统提供安全保护,这个技术安全吗?  我看过Imagination Technologies公司CEO HosseinYassaie在接受媒体采访时说&打个比方说,这个TrustZone技术就像是银行的一个保险柜,你可以把认为安全的应用都放进去,在以前,应用都比较单一,这样的安全防护也许有一定的作用,但是现在,手机等移动设备都集成了很多应用,这些都放在一个保险柜中显然安全风险就增大了很多。&  在CPU内核的设计中集成系统安全性扩展,是TrustZone在ARMv6内核架构下的重要扩展特性之一,TrustZone分离了两个并行执行的环境:非安全的&普通&执行环境;安全可信任的&安全&环境,但是问题来了,如果一个应用伪装成&可信任的&进入到你的安全区会怎么样?其他应用和数据还会安全吗?  因此全局硬件虚拟化(Virtualization-VZ)技术才是一个真正安全的技术,Hypervisor之于操作系统类似于操作系统之于进程。它们为应用执行提供独立的VZ虚拟硬件平台,而VZ虚拟硬件平台反过来又提供对底层机器的虚拟的完整访问。Imaginaition将把Hypervisor VZ全局硬件虚拟化技术从传统服务器领域带入现代嵌入式领域的每一个角落。  全局虚拟化就是每个应用都是独立的沙箱操作,两个不同窗口都是不同的沙箱  这样一来,黑客攻破难度大很多很多,攻破一个完全虚拟的是非常难的,你都知道到它的原理去怎么攻破?&  4、GPU未来拼什么?  PC时代,GPU基本都是完成3D图形加速,而移动互联时代,随着智能化的提升,GPU强大的并行能力可以把它的应用拓展到更多领域,GPU应该是其未来的发展方向,现在安卓已经可以支持GPU通用计算。  我看很多评测机构也在看GPU在手机平板等产品上的重要作用,GPU不仅游戏体验,在照相处理、UI显示、滑动处理甚至安全方面都在发挥巨大作用,我看很多复杂应用CPU也就开到2、3个核而GPU是应用的主力军,所以,未来GPU的地位会提升很多。尤其随着ARVR应用的普及,更需要强大的GPU来支持的。  5、缓存、乱序和流水线的秘密  其实看到自从CPU诞生到现在,一直在解决CPU和内存的瓶颈问题,而且这个问题一直没有得到解决所以业界是通过增加缓存来解决,很多移动处理器已经增加了一级缓存二级缓存甚至三级缓存,所以大家在比较CPU性能的时候,别光看CPU的主频,还要看CPU的缓存面积以及带来的DDR功耗问题,要看整体功耗。  如何衡量CPU的性能?其实很简单,执行相同任务时功耗越低越好。而且要多比较,采取不同常用的场景来测试SOC功耗。  还有CPU常用的流水线、乱序等概念,流水线理论上是级数越多跑的越快,比如9级比7级流水线跑的快,但是如果执行不够,CPU就会空跑,形象地比喻就是吃饭时噎住了。  我觉得CPU未来解决性能问题有几个方向:  一个是,单核增加流水线,增加发射,从单发射到双发射到四发射(发射越多执行指令越多),但这个发展方向似乎走不通。  另一个方向就是增加多核多线程,增加并行度,这里再提提MIPS内核,其实这个内核架构很好,没有多核数量的限制,一些网络设备都有上百个内核的产品。  还有是可以乱序执行,这是提升效率的方法,一般高端CPU有乱序执行功能。  我个人认为CPU的时代已经过去了,未来是异构SOC的时代,协处理器会大发展,什么VPU、DPU、ISP、无线IP等等会采用更多,比如联发科6595中的4K视频编解码器就是一颗协处理器,它完成了非常复杂的功能。收藏1080本文为OFweek公众号作者发布,不代表OFweek立场。如有侵权或其他问题,请联系举报。+关注文章页右侧位置300*250
相关公众号
有料、接地气,科技也可以如此有趣。关注些科技实事,IT、互联网、数码、消费电子等相关信息畅聊与科技有关的话题。分享半导体产业链资讯及数据,前沿产品、技术、观点尽在于此。聚焦各领域科技变革。投诉文章问题&营销广告重复、旧闻格式问题低俗标题夸张与事实不符疑似抄袭我有话要说确定取消取消
用户登录&请输入用户名请输入密码登 录使用一下账号直接登录

我要回帖

更多关于 销售工程师是做什么的 的文章

 

随机推荐