请
登录
后使用快捷导航
没有帐号?
注册
登录
注册
快捷导航
首页
论坛
BBS
博客
技术栈
ITPUB学院
名人堂
版主团
搜索
高级搜索
热搜:
oracle
SAP
sap
二维码
dba
Oracle
c++
C++
CRM
银联信息中心
比特币
小额贷款
贷款
crm
ORACLE
项目管理系统
thread
android
python
java
本版
文章
帖子
用户
ITPUB论坛-专业的IT技术社区
»
论坛
›
GPU计算与编程技术
›
技术交流
›
CUDA程序设计讨论区
›
数据从显存拷贝到内存怎么这么慢呢 花了6s...
1
2
/ 2 页
返回列表
楼主:
sinoenix
收藏
|
[求助]
数据从显存拷贝到内存怎么这么慢呢 花了6s...
[复制链接]
yyfn风辰
yyfn风辰
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
21
11
#
发表于 2010-4-15 10:07
|
只看该作者
回复 #10 sinoenix 的帖子
呵呵!这个同步的时间主要是内核的执行时间。
使用道具
举报
回复
显身卡
NvidiaCTC
NvidiaCTC
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
0
12
#
发表于 2010-4-15 12:52
|
只看该作者
kernel的执行是异步的,只有做一次CPU-GPU同步以后才能保证kernel运行完以后才开始记时
否则kernel发射到显卡以后继续运行下面的CPU代码
所以此时memcpy开始计时,但是要等到kernel完成以后GPU才会进行memcpy
使用道具
举报
回复
显身卡
OpenHero
OpenHero
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
12
13
#
发表于 2010-4-15 12:54
|
只看该作者
利用 memcopy来隐式的同步,memcopy会保证kernel都运行完了。
如果只是测试kernel的运行时间,需要在kernel后面加上同步指令,kernel发射是异步的。
如果测试kernel和memcpy的时间,可以直接利用memcopy的隐式同步方式。
当然,这里的memcpy需要使用同步方式的memcpy,不能使用异步的拷贝,在内存拷贝之后测试时间,就可以保证测试的是kernel+内存copy的时间。
[
本帖最后由 OpenHero 于 2010-4-15 13:20 编辑
]
使用道具
举报
回复
显身卡
NvidiaCTC
NvidiaCTC
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
0
14
#
发表于 2010-4-15 13:05
|
只看该作者
改用memcpy对计时正确性是没用的
必须用CPU-GPU同步保证
[
本帖最后由 NvidiaCTC 于 2010-4-15 13:08 编辑
]
使用道具
举报
回复
显身卡
sinoenix
sinoenix
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
0
15
#
楼主
|
发表于 2010-4-16 14:48
|
只看该作者
哦 这下明白了 谢谢大家了 呵呵
使用道具
举报
回复
显身卡
1
2
/ 2 页
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
IT服务管理
SAP相关文档
系统设计与建模
HR产品与实践
Java入门与认证版
Java企业开发
Oracle电子文档
Oracle EBS R12
国内数据库产品
项目过程
MySQL及其它开源数据库
物流与供应链
医卫行业
ERP产品与实践
Oracle专题深入讨论
数据仓库与数据挖掘
SAP Business One开发与快速实施
CUDA技术资料
网络系统集成 【已迁移到IXPUB】
TOP
技术积分榜
社区积分榜
徽章
团队
统计
知识索引树
积分竞拍
文本模式
帮助
ITPUB首页
|
ITPUB论坛
|
数据库技术
|
企业信息化
|
开发技术
|
微软技术
|
软件工程与项目管理
|
IBM技术园地
|
行业纵向讨论
|
IT招聘
|
IT文档
ChinaUnix
|
ChinaUnix博客
|
ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有
联系我们
未成年人举报专区
京ICP备16024965号-8
北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
快速回复
返回顶部
返回列表