|
原帖由 门非流 于 2010-9-16 22:26 发表 ![]()
对于解决一些问题用串行算法实现,再进行优化,这些难度都不是很大。但是映射到CUDA编程模式上的时候,需要受到线程的制约,现在只有一个GRID,而一个BLOCK里面最大的线程数量是512,虽然将来会有所加大,但是对于一些问题的解决还是受到线程的制约,在进行优化的过程中,会发现很多地方需要回避线程的局限性,比如说:稀疏矩阵(20000*20000)线性方程求解。
20000*20000的稀疏矩阵求解根本就没有限制,现在只要足够的显存,千万自由度的稀疏矩阵的求解一样没有问题,不知道你说的限制是什么 |
|