12
返回列表 发新帖
楼主: sinoenix

[求助] 数据从显存拷贝到内存怎么这么慢呢 花了6s...

[复制链接]
论坛徽章:
21
2010新春纪念徽章
日期:2010-03-01 11:08:292012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:25版主3段
日期:2012-05-15 15:24:11马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:12:25
11#
发表于 2010-4-15 10:07 | 只看该作者

回复 #10 sinoenix 的帖子

呵呵!这个同步的时间主要是内核的执行时间。

使用道具 举报

回复
论坛徽章:
0
12#
发表于 2010-4-15 12:52 | 只看该作者
kernel的执行是异步的,只有做一次CPU-GPU同步以后才能保证kernel运行完以后才开始记时
否则kernel发射到显卡以后继续运行下面的CPU代码
所以此时memcpy开始计时,但是要等到kernel完成以后GPU才会进行memcpy

使用道具 举报

回复
论坛徽章:
12
2010新春纪念徽章
日期:2010-03-01 11:08:29马上有对象
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有车
日期:2014-02-19 11:55:142011新春纪念徽章
日期:2011-02-18 11:42:502011新春纪念徽章
日期:2011-01-25 15:42:562011新春纪念徽章
日期:2011-01-25 15:42:332011新春纪念徽章
日期:2011-01-25 15:42:152011新春纪念徽章
日期:2011-01-25 15:41:50
13#
发表于 2010-4-15 12:54 | 只看该作者
利用 memcopy来隐式的同步,memcopy会保证kernel都运行完了。
如果只是测试kernel的运行时间,需要在kernel后面加上同步指令,kernel发射是异步的。
如果测试kernel和memcpy的时间,可以直接利用memcopy的隐式同步方式。
当然,这里的memcpy需要使用同步方式的memcpy,不能使用异步的拷贝,在内存拷贝之后测试时间,就可以保证测试的是kernel+内存copy的时间。

[ 本帖最后由 OpenHero 于 2010-4-15 13:20 编辑 ]

使用道具 举报

回复
论坛徽章:
0
14#
发表于 2010-4-15 13:05 | 只看该作者
改用memcpy对计时正确性是没用的
必须用CPU-GPU同步保证

[ 本帖最后由 NvidiaCTC 于 2010-4-15 13:08 编辑 ]

使用道具 举报

回复
论坛徽章:
0
15#
 楼主| 发表于 2010-4-16 14:48 | 只看该作者
哦 这下明白了  谢谢大家了 呵呵

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表