吧里有没有写卢克纳尔的书CUDA

查看: 3665|回复: 26
大家帮我看看这个使用CUDA加速的Demo能不能运行
阅读权限30
主题帖子精华
本帖最后由 姜黎明Leon 于
15:18 编辑
最近在忙毕业论文,主题是关于使用CUDA加速图像处理的。
写了个论文用的Demo,想请大家帮我看看能不能运行。
A卡就别试了,有支持CUDA的N卡用户帮我试试吧。
欢迎贴一下你CPU和显卡的配置,还有speed ratio加速比,看看你的显卡加速效果怎么样。
楼主最近帖子
论坛最新回复
阅读权限30
主题帖子精华
功能是啥?
简单的模糊算法,没有任何优化,所以是用来说明CUDA在并行处理上加速效果的&
阅读权限30
主题帖子精华
本帖最后由 姜黎明Leon 于
15:10 编辑
电影梦 发表于
功能是啥?
简单的模糊算法,没有任何优化,所以是用来说明CUDA在并行处理上加速效果的。
写论文用的东西,没啥创新,可惜周围同学都迷信A卡,没人用N卡,不知道别人机器上能运行不。
阅读权限30
主题帖子精华
高斯模糊?如果是静态编译的应该没问题。
因为用了CUDA加速,所以不知道和硬件结合的时候会不会出问题。
在我机子的环境上可以运行,不知道别的机器会不会却文件,所以请大家测试一下。
我已经把CUDA的dll放在里面了,在同学的A卡上会有错误信息提示,所以&
阅读权限30
主题帖子精华
写论文的东西怎么能没有创新呢?你不怕导师气的吐血?
如果是自己搭建实验平台的话,用matlab就行了啊,
干嘛自己实现呢,开源代码估计有一堆了。
本科论文嘛,你懂的,跟考试没啥区别,我当大作业做的。当然也有提出了几种优化方法,不过基本都是前人搞过的,创新不容易啊。&
老师开的题目是 基于CUDA的数字图像并行处理。只好自己用C写一个了,要不然论文没数据不好看&
阅读权限30
主题帖子精华
本帖最后由 姜黎明Leon 于
03:54 编辑
电影梦 发表于
高斯模糊?如果是静态编译的应该没问题。
因为用了CUDA加速,所以不知道和硬件结合的时候会不会出问题。
在我机子的环境上可以运行,不知道别的机器会不会缺文件,所以请大家测试一下。
我已经把CUDA的dll放在里面了,应该可以运行的,因为在同学的A卡上运行会有我设计好的错误信息提示。还是想请大家帮我测试一下,顺便贴下数据好让我参考一下。
阅读权限30
主题帖子精华
电影梦 发表于
写论文的东西怎么能没有创新呢?你不怕导师气的吐血?
如果是自己搭建实验平台的话,用matlab就行了啊,
老师开的题目是《基于CUDA的数字图像并行处理》,所以只好自己用C写一个了,要不然论文没数据不好看
阅读权限60
主题帖子精华
本帖最后由 LSBL 于
16:45 编辑
运行出现这个东西,成功了么?GPU比CPU快70倍? AMD 640开6,660显卡。
ccc.jpg (79.11 KB, 下载次数: 13)
16:42 上传
我设计了5次循环计算,取平均值衡量算法时间。
你可以用更大的图试试,不过要用PS修改成灰度图像,并且保存成lena.bmp。
不过CPU可能要算N久,不要以为死机了,放那等一会就知道GPU计算有多快了。
当然毕竟只是个&
它会在程序目录生成处理后的图,你可以看一下,感谢测试。&
你的加速比是70.70x,和我差不多。
我用来说明同样的算法在GPU上执行的效率有巨大提升。
当然我这个demo只用了一个CPU核心进行计算,不过即使算上6个核的CPU,加速效果还是很明显的。&
阅读权限30
主题帖子精华
LSBL 发表于
运行出现这个东西,成功了么?GPU比CPU快70倍? AMD 640开6,660显卡。
你的加速比是70.70x,和我差不多。
是用来说明同样的算法在GPU上执行的效率有巨大提升的。
当然我这个demo只用了一个CPU核心进行计算,不过即使算上6个核的CPU,加速效果还是很明显的。
你这个程序对CPU/GPU利用率不高,运行时看了一下占用,好象CPU18%不到,GPU才7%. 肯定不准,要改进。&
阅读权限30
主题帖子精华
LSBL 发表于
运行出现这个东西,成功了么?GPU比CPU快70倍? AMD 640开6,660显卡。
我设计了5次循环计算,取平均值衡量算法时间。
你可以用更大的图试试,不过要用PS修改成灰度图像,并且保存成lena.bmp。
不过CPU可能要算N久,不要以为死机了,放那等一会就知道GPU计算有多快了。
当然毕竟只是个写论文用的demo,所以只是为了说明问题,其实程序实用性不大。还是感谢测试。
阅读权限60
主题帖子精华
姜黎明Leon 发表于
你的加速比是70.70x,和我差不多。
是用来说明同样的算法在GPU上执行的效率有巨大提升的。
当然我这个d ...
你这个程序对CPU/GPU利用率不高,运行时看了一下占用,好象CPU18%不到,GPU才7%. 肯定不准,要改进。
对的,你可以看看大图的GPU占用,理论上讲图像越大GPU占用越高。我刚试了个,CPU慢的让人以为死循环了,结果GPU刷一下,占用能达到90%多。&
应该是图像太小,所以GPU占用不高,或者计算太快没有测量准确。如果GPU占用是准确的话,你看CPU都18%了,而GPU才7%,结果居然快70倍,可见加速效果更明显了。&
刚才试了一张大图,CPU算了好几分钟,GPU一瞬间就算完了。如果对比时间是靠谱的,那显卡的执行效率也太惊人了。&
CPU我这里能达到25%也就是一个核心,你是6核所以18%是正常的。&
对,这个是没有任何优化的版本,所以效率不高。不过还是能用来说明问题的。&
阅读权限30
主题帖子精华
LSBL 发表于
你这个程序对CPU/GPU利用率不高,运行时看了一下占用,好象CPU18%不到,GPU才7%. 肯定不准,要改进。
应该是图像太小,所以GPU占用不高,或者计算太快没有测量准确。如果GPU占用是准确的话,你看CPU都18%了,而GPU才7%,结果居然快70倍,可见加速效果更明显了。
阅读权限60
主题帖子精华
有mac能运行的么,我试一下690
如果计算进价格因素的话,我认为目前gpu的运算能力应该是cpu的5倍左右。所以真正的大数据量计算任务更适合gpu。&
我是用vc写的,我还完全没有mac编程经验&
阅读权限60
居住地云南省 昆明市
主题帖子精华
1.jpg (55.16 KB, 下载次数: 12)
17:51 上传
2.jpg (65.72 KB, 下载次数: 10)
17:51 上传
搞计算机图形学的么~都是牛人啊~当年就没学懂~
创作路线-_-||&
未来还是打算走创造路线,这个也算借写论文的机会玩票搞次技术了&
从你这个gpu时间上看,也说明了5000的cuda计算优势并不明显。&
阅读权限30
主题帖子精华
对了,这个demo在计算的时候用的都是用32bit浮点精度,和当前商用算法的精度一致,有一定的代表性。
阅读权限30
主题帖子精华
我今天答辩很成功,非常感谢各位的测试。
你是什么学校的?&
阅读权限30
主题帖子精华
本帖最后由 姜黎明Leon 于
03:48 编辑
我目前有两个打算做的项目,一个是用OpenFX写个镜头模糊的插件给达芬奇。
因为达芬奇内的模糊没有焦外成像的感觉,我不是很喜欢这个效果。我做了几个测试发现它的算法应该是高斯模糊。正好达芬奇10开始支持OFX了,我想写个插件来做镜头模糊。
我测试了几个软件的镜头模糊,PS镜头模糊的新版本,nuke的Z-blur,不出意外的它们的复杂度都是n^2,我打算做个复杂度n的优化,也就是说模糊半径越大提速效果越明显。有可能的话会用上CUDA做GPU加速的功能。我还没测试nuke7的新版zDefocus,如果它没有用我想到的这个优化方法,也可以放到nuke上加速镜头模糊。
阅读权限30
主题帖子精华
本帖最后由 姜黎明Leon 于
03:49 编辑
还准备做个去重复帧的玩意。
因为最近看到一个非常棒的动漫剪辑。作者借助RE的Twixtor提高动画的帧率。由于日本动漫都是一拍三、一拍二,会有重复帧出现,而且出现的不规律。作者为了用Twixtor,需要手动去重复帧。
我觉得这个技巧做出的效果非常棒,只是做起了来太耗时太辛苦了,就打算写个程序检测去除重复帧。借助电脑做这种重复性的工作。
这个作者绝对是个高手。Twixtor提高帧率的效果非常惊人,我相信这个技术一定会在动漫MAD制作圈产生巨大影响。
附上观看:
& && && && && && && && && && && && && && && && && && && && && && && && && && && && && && && && && && & 点此关闭弹幕↑
想好的事情就去做.&
阅读权限60
主题帖子精华
姜黎明Leon 发表于
还准备做个去重复帧的玩意。
因为最近看到一个非常棒的动漫剪辑。作者借助RE的Twixtor提高动画的帧率。由于 ...
想好的事情就去做.
阅读权限60
公司北京易乐多文化发展有限公司
主题帖子精华
姜黎明Leon 发表于
我今天答辩很成功,非常感谢各位的测试。
你是什么学校的?
哪个城市?不错,会写插件啊,能否试试把蓝宝石的openfx的插件转移到达芬奇9上&
阅读权限60
公司北京易乐多文化发展有限公司
主题帖子精华
coolen007 发表于
你是什么学校的?
哪个城市?不错,会写插件啊,能否试试把蓝宝石的openfx的插件转移到达芬奇9上
最希望的是optical flares 能植入达芬奇和scratch,现在已经for nuke了&
其实算法什么的还是比较好做的,写插件还是需要看openfx的api文档,边学边写吧。我看好openfx,未来插件开发难度和周期应该能降低很多&
我觉得插件厂商肯定会马上跟进的,毕竟ofx够开放移植难度不大,以后就有的玩了&
达芬奇9好像不支持ofx,等10出来看看支持效果怎么样吧。我觉得10的这个点都没什么人关注,这是要开放插件的节奏啊,意义太重大了&
阅读权限60
公司北京易乐多文化发展有限公司
主题帖子精华
coolen007 发表于
哪个城市?不错,会写插件啊,能否试试把蓝宝石的openfx的插件转移到达芬奇9上
最希望的是optical flares 能植入达芬奇和scratch,现在已经for nuke了
对了,我可以写个新插件,但是移植这种事没有源代码是不好做的,只能等插件制作者。不知道ak他们是支持nuke自己的插件系统还是通过openfx支持。如果是后者,别的ofx宿主也应该快了。&
阅读权限60
主题帖子精华
本帖最后由 色A 于
13:01 编辑
测试的结果不稳定。从55-67都有
CPU: i7-2600
GPU: GTX570
我论文用的数据都是空载得到的,不知道你是不是这个原因。如果你是用了不同分辨率,这是正常的。等我论文定稿交到学校没问题了,我可以分享给大家看看。里面会有数据分析,给大家科普一下。&
阅读权限30
主题帖子精华
本帖最后由 姜黎明Leon 于
01:29 编辑
嗯,说好的把论文放上来,所以我来挖坟了。
这种本科论文基本不会被收录,能读到的也就只有自己的导师了。
不如放到论坛里,还能普及一下数字图像处理和CUDA的知识。
论文的pdf档、测试程序和数据、答辩ppt都放在里面,算是对自己半年时光的一个总结吧。
阅读权限30
主题帖子精华
本帖最后由 姜黎明Leon 于
02:04 编辑
估计下载看的人不多,我把“致谢”放上来吧,为了感谢论坛的朋友们帮助我测试程序。
致& & 谢& && & 在论文定稿即将呈交到学校的时候,我突然有了完成“致谢”的强烈冲动。这篇不起眼的论文,经过近半年的打磨终于要成为一个独立的存在了。就像是一个孩子即将独立成人一般,想到这里我突然感慨万千。
& && & “孩子”长到今天,并没有经历太多的波澜,就像我的前半生一样顺其自然。然而,能够达到这种平平淡淡,反而需要怎样的天时、地利与人和啊。体会到这其中的种种机缘与巧合,让我不得不心怀感激。
& && & 感谢我的母亲张龙芝、父亲姜照森,是他们把我带到这个斑斓的世界,给了我体悟大千世界的机会;
& && & 感谢母校华中师范大学,为我提供探索未知的土壤,培养了我独立思考的能力;
& && & 感谢信息与新闻传播学院的各位老师,教授我无价的知识,为我的人生指引方向;
& && & 感谢我的导师姚璜老师,带领我进入数字图像处理领域,并且付出宝贵的时间和智慧为我的论文出谋划策、指点迷津;
& && & 感谢我的同学和朋友们,陪我度过人生中最美好最充实的四年。
& && & 我还要感谢AcFun弹幕视频网,在论文写作之余给我带来的欢乐和感动;
& && & 感谢拍电影BBS上的网友们,在论文的实验阶段帮助我测试程序;
& && & 感谢那些不曾相识但曾相助的人们。
& && & 我知道现在有可以自动生成致谢的方法,然而我希望即便是“致谢”,作为论文的一部分依然是我独立完成的,不掺杂半点虚假。并且,我相信这些文字里流露出的满满的谢意,能够被所有帮助过我的人感受得到。
& && & 感谢你们!
阅读权限60
主题帖子精华
来晚了没赶上,楼主是个人才
阅读权限60
主题帖子精华
从14L和8L的对比来看,是Q5000的CUDA效能不如GTX660?
Powered by关于cuda的详细介绍- Python教程-PHP中文网QQ群微信公众号还没有收藏关于cuda的详细介绍下面小编就为大家带来一篇使用Python写CUDA程序的方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧使用Python写CUDA程序有两种方式: * Numba * PyCUDAnumbapro现在已经不推荐使用了,功能被拆分并分别被集成到accelerate和Numba了。例子numbaNumba通过及时编译机制(JIT)优化Python代码,Numba可以针对本机的硬件环境进行优化,同时支持CPU和GPU的优化,并且可以和Numpy集成,使Python代码可以在GPU上运行,只需在函数上方加上相关的指令标记,如下所示:import numpy as np
from timeit import default_timer as timer
from&nbsp1. 简介:下面小编就为大家带来一篇使用Python写CUDA程序的方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧2. 简介:1.设置服务器参数innodb_file_per_table=ONinnodb_file_format=Barracuda 2.创建表或者修改表参数alter table sod_song_log_20143. 简介:第一次这么正式的写技术博客,一是锻炼下写总结的能力,二来也算是由于自己看技术贴多却从来没有贡献过自己的感到羞愧. 1.准备 一.首先,运行环境为ubuntu14.04 ,因此本文都假设大家已经装好了ubuntu14.04,另外,cuda时nvidia公司为自己的gpu设计的编程架构,因此4. 简介:对集群计算而言,使用MPICH2连接并控制各个节点,使用 OpenMP 在节点内充分对CPU及各个CPU核心进行并行化,是比较低成本且万精油的解决方案。(异构计算估计要OpenCL 或者 CUDA 参与,没搞过)。MPI(CH2)是应用于分布式计算设施的并行化技术,OpenMP与之对应以上就是关于cuda的详细介绍的详细内容,更多请关注php中文网其它相关文章!共3篇227点赞收藏分享:.php.cn&猜你喜欢PHP中文网:独家原创,永久免费的在线,php技术学习阵地!
All Rights Reserved | 皖B2-QQ群:关注微信公众号【用CUDA玩视差贴图】谁说的CUDA不支持视差?就让我来终结!_minecraft体积云吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0可签7级以上的吧50个
本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:270贴子:
【用CUDA玩视差贴图】谁说的CUDA不支持视差?就让我来终结!
效果图镇楼
效果相当给力哟~~
材质用的是R3D·Craft的128X原版视差,虽然个人喜欢平滑系列
屁,我有视差版,POM,再说了,你拿普通人的材质包装逼算什么!!!
工作台上奇怪的突起OAO
我已经无力吐槽了,普通人材质包改的是128x的平滑材质,而楼主用的是128x的R3D普通
马克,完了研究材质包,我已经好久没做材质包了
换个材质……龙之舞材质
有人说我光影开好了,材质用好了,但就是没有视差效果,怎么回事呢?我鼠标指向的按钮要开成ON才有视差效果,另外还需要光影支持
表示现在坐等CUDAv5.0的视差版本
说好的材质呢
显卡对比图23333(我真的没有黑I卡)
什么配置能玩得起低配啊
I卡表示不服
可惜CUDA没高光,如果有了的话,相比SEUS我更喜欢CUDA。
本来就可以啊   --(/ω\)我的十五字不见了你有没有看到呢?
贴吧热议榜
使用签名档&&
保存至快速回贴

我要回帖

更多关于 有没有写卢克纳尔的书 的文章

 

随机推荐