请
登录
后使用快捷导航
没有帐号?
注册
登录
注册
快捷导航
首页
论坛
BBS
博客
技术栈
ITPUB学院
名人堂
版主团
搜索
高级搜索
热搜:
oracle
SAP
sap
二维码
dba
Oracle
c++
C++
CRM
银联信息中心
比特币
小额贷款
贷款
crm
ORACLE
项目管理系统
thread
android
python
java
本版
文章
帖子
用户
ITPUB论坛-专业的IT技术社区
»
论坛
›
GPU计算与编程技术
›
技术交流
›
CUDA程序设计讨论区
›
数据从显存拷贝到内存怎么这么慢呢 花了6s...
1
2
/ 2 页
返回列表
楼主:
sinoenix
收藏
|
[求助]
数据从显存拷贝到内存怎么这么慢呢 花了6s...
[复制链接]
yyfn风辰
yyfn风辰
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
21
11
#
发表于 2010-4-15 10:07
|
只看该作者
回复 #10 sinoenix 的帖子
呵呵!这个同步的时间主要是内核的执行时间。
使用道具
举报
回复
显身卡
NvidiaCTC
NvidiaCTC
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
0
12
#
发表于 2010-4-15 12:52
|
只看该作者
kernel的执行是异步的,只有做一次CPU-GPU同步以后才能保证kernel运行完以后才开始记时
否则kernel发射到显卡以后继续运行下面的CPU代码
所以此时memcpy开始计时,但是要等到kernel完成以后GPU才会进行memcpy
使用道具
举报
回复
显身卡
OpenHero
OpenHero
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
12
13
#
发表于 2010-4-15 12:54
|
只看该作者
利用 memcopy来隐式的同步,memcopy会保证kernel都运行完了。
如果只是测试kernel的运行时间,需要在kernel后面加上同步指令,kernel发射是异步的。
如果测试kernel和memcpy的时间,可以直接利用memcopy的隐式同步方式。
当然,这里的memcpy需要使用同步方式的memcpy,不能使用异步的拷贝,在内存拷贝之后测试时间,就可以保证测试的是kernel+内存copy的时间。
[
本帖最后由 OpenHero 于 2010-4-15 13:20 编辑
]
使用道具
举报
回复
显身卡
NvidiaCTC
NvidiaCTC
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
0
14
#
发表于 2010-4-15 13:05
|
只看该作者
改用memcpy对计时正确性是没用的
必须用CPU-GPU同步保证
[
本帖最后由 NvidiaCTC 于 2010-4-15 13:08 编辑
]
使用道具
举报
回复
显身卡
sinoenix
sinoenix
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
0
15
#
楼主
|
发表于 2010-4-16 14:48
|
只看该作者
哦 这下明白了 谢谢大家了 呵呵
使用道具
举报
回复
显身卡
1
2
/ 2 页
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
物流与供应链
SAP相关文档
ERP产品与实践
国内数据库产品
SAP Business One开发与快速实施
项目过程
系统设计与建模
Oracle专题深入讨论
TOP
技术积分榜
社区积分榜
徽章
团队
统计
知识索引树
积分竞拍
文本模式
帮助
ITPUB首页
|
ITPUB论坛
|
数据库技术
|
企业信息化
|
开发技术
|
微软技术
|
软件工程与项目管理
|
IBM技术园地
|
行业纵向讨论
|
IT招聘
|
IT文档
ChinaUnix
|
ChinaUnix博客
|
ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有
联系我们
未成年人举报专区
京ICP备16024965号-8
北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
快速回复
返回顶部
返回列表