__device__ int * 类型变量的初始化

NvidiaCTC · 发表于 2010-4-15 23:08

Good try

cudaMalloc((void **)&d_test_a, sizeof(int));
这一句会重写掉d_test_a中先前被赋的指针。

hjiang556 · 发表于 2010-4-15 23:11

原帖由 NvidiaCTC 于 2010-4-15 22:26 发表
__device__ int* dp;

// allocate host memory
int* h_idata = (int*) malloc( mem_size);
// initalize the memory
for( unsigned int i = 0; i < num_threads; ++i)
{
      h_idata = (int) i;
}

//allocate device memory
int* d_idata;
cutilSafeCall( cudaMalloc( (void**) &d_idata, mem_size));

//copy host memory to device
cutilSafeCall( cudaMemcpy( d_idata, h_idata, mem_size,
                           cudaMemcpyHostToDevice) );

cutilSafeCall( cudaMemcpyToSymbol (dp, &d_idata, sizeof(int*), 0, cudaMemcpyHostToDevice));
__global__ void
testKernel(  int* g_odata)
{
  // write data to global memory
  g_odata[tid] = dp[tid];
}

哇～～多谢多谢～终于成功了。

感谢感谢，可是我还有一个不太明白的地方，cudaMemcpyToSymbol() 和cudaMemcpy() 的差别是什么？我尝试把 cudaMemcpyToSymbol (dp, &d_idata, sizeof(int*), 0, cudaMemcpyHostToDevice) 这句换成 cudaMemcpy( &dp, &h_idata, sizeof(int *),cudaMemcpyHostToDevice) ，结果就不成了，这是为什么？

NvidiaCTC · 发表于 2010-4-15 23:16

如cuda2010所说
主机端和设备端地址空间很容易弄混

hjiang556 · 发表于 2010-4-15 23:21

在我机器上还是打印出0。我之前也有试过这样，和你这段代码唯一的区别是我用的是 cudaGetSymbolAddress((void **)&d_test_a, test_a); 而你用的是 cudaGetSymbolAddress((void **)&d_test_a, "test_a"); 。这句中为什么要用 “test_a”是什么意思呢？

hjiang556 · 发表于 2010-4-15 23:23

哦。我明白了。dp 是设备端的地址空间，所以不能用cudaMemcpy( &dp, &h_idata, sizeof(int *),cudaMemcpyHostToDevice)，对吗？

cuda2010 · 发表于 2010-4-15 23:37

的确存在这个问题, 我在10#的代码也不正确。(不过在我机器上输出结果是正确的所以没有仔细检查)
不过9#的代码也有点问题，dp没有分配空间就使用了(如果dp的定义是__device__ int dp[1]那么9#代码是正确的)。
看来还是应该避免这种使用方法。

原帖由 NvidiaCTC 于 2010-4-15 23:08 发表
Good try

cudaMalloc((void **)&d_test_a, sizeof(int));
这一句会重写掉d_test_a中先前被赋的指针。

hjiang556 · 发表于 2010-4-15 23:51

原帖由 cuda2010 于 2010-4-15 23:37 发表
的确存在这个问题, 我在10#的代码也不正确。(不过在我机器上输出结果是正确的所以没有仔细检查)
不过9#的代码也有点问题，dp没有分配空间就使用了(如果dp的定义是__device__ int dp[1]那么9#代码是正确的)。
看来还是应该避免这种使用方法。

9楼的代码是对的啊。他是用了一个BUFFER变量d_idata,然后给d_idata在device上申请了空间，再把这个空间的地址拷给了dp。这样实现的给dp申请空间。

cuda2010 · 发表于 2010-4-16 00:40

验证了一下，9楼的代码的确是正确的，是我理解错了。

[交流] device int * 类型变量的初始化

回复 #10 cuda2010 的帖子

回复 #13 NvidiaCTC 的帖子

浏览过的版块

[交流] __device__ int * 类型变量的初始化

回复 #10 cuda2010 的帖子

回复 #13 NvidiaCTC 的帖子

浏览过的版块

[交流] device int * 类型变量的初始化