12
返回列表 发新帖
楼主: hjiang556

[交流] __device__ int * 类型变量的初始化

[复制链接]
论坛徽章:
0
11#
发表于 2010-4-15 23:08 | 只看该作者
Good try

cudaMalloc((void **)&d_test_a, sizeof(int));
这一句会重写掉d_test_a中先前被赋的指针。

使用道具 举报

回复
论坛徽章:
0
12#
 楼主| 发表于 2010-4-15 23:11 | 只看该作者
原帖由 NvidiaCTC 于 2010-4-15 22:26 发表
__device__ int* dp;

// allocate host memory
    int* h_idata = (int*) malloc( mem_size);
    // initalize the memory
    for( unsigned int i = 0; i < num_threads; ++i)
    {
        h_idata = (int) i;
    }

    //allocate device memory
    int* d_idata;
    cutilSafeCall( cudaMalloc( (void**) &d_idata, mem_size));

    //copy host memory to device
    cutilSafeCall( cudaMemcpy( d_idata, h_idata, mem_size,
                               cudaMemcpyHostToDevice) );
   
   cutilSafeCall( cudaMemcpyToSymbol (dp, &d_idata, sizeof(int*), 0, cudaMemcpyHostToDevice));
__global__ void
testKernel(  int* g_odata)
{
  // write data to global memory
  g_odata[tid] = dp[tid];
}



哇~~多谢多谢~终于成功了。

感谢感谢,可是我还有一个不太明白的地方,cudaMemcpyToSymbol() 和cudaMemcpy() 的差别是什么? 我尝试把  cudaMemcpyToSymbol (dp, &d_idata, sizeof(int*), 0, cudaMemcpyHostToDevice) 这句换成 cudaMemcpy( &dp, &h_idata, sizeof(int *),cudaMemcpyHostToDevice) , 结果就不成了,这是为什么?

使用道具 举报

回复
论坛徽章:
0
13#
发表于 2010-4-15 23:16 | 只看该作者
如cuda2010所说
主机端和设备端地址空间很容易弄混

使用道具 举报

回复
论坛徽章:
0
14#
 楼主| 发表于 2010-4-15 23:21 | 只看该作者

回复 #10 cuda2010 的帖子

在我机器上还是打印出0。我之前也有试过这样,和你这段代码唯一的区别是我用的是 cudaGetSymbolAddress((void **)&d_test_a, test_a); 而你用的是 cudaGetSymbolAddress((void **)&d_test_a, "test_a"); 。这句中为什么要用 “test_a”是什么意思呢?

使用道具 举报

回复
论坛徽章:
0
15#
 楼主| 发表于 2010-4-15 23:23 | 只看该作者

回复 #13 NvidiaCTC 的帖子

哦。我明白了。dp 是设备端的地址空间,所以不能用cudaMemcpy( &dp, &h_idata, sizeof(int *),cudaMemcpyHostToDevice), 对吗?

使用道具 举报

回复
论坛徽章:
0
16#
发表于 2010-4-15 23:37 | 只看该作者
的确存在这个问题, 我在10#的代码也不正确。(不过在我机器上输出结果是正确的所以没有仔细检查)
不过9#的代码也有点问题,dp没有分配空间就使用了(如果dp的定义是__device__ int dp[1]那么9#代码是正确的)。
看来还是应该避免这种使用方法。


原帖由 NvidiaCTC 于 2010-4-15 23:08 发表
Good try

cudaMalloc((void **)&d_test_a, sizeof(int));
这一句会重写掉d_test_a中先前被赋的指针。

使用道具 举报

回复
论坛徽章:
0
17#
 楼主| 发表于 2010-4-15 23:51 | 只看该作者
原帖由 cuda2010 于 2010-4-15 23:37 发表
的确存在这个问题, 我在10#的代码也不正确。(不过在我机器上输出结果是正确的所以没有仔细检查)
不过9#的代码也有点问题,dp没有分配空间就使用了(如果dp的定义是__device__ int dp[1]那么9#代码是正确的)。
看来还是应该避免这种使用方法。




9楼的代码是对的啊。他是用了一个BUFFER变量d_idata,然后给d_idata在device上申请了空间,再把这个空间的地址拷给了dp。这样实现的给dp申请空间。

使用道具 举报

回复
论坛徽章:
0
18#
发表于 2010-4-16 00:40 | 只看该作者
验证了一下,9楼的代码的确是正确的,是我理解错了。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表