|
原帖由 ~贝贝~ 于 2011-1-7 17:28 发表 ![]()
3、课题主题:矩阵与向量乘法的优化 演讲人:风辰
个人简介:目前担任itpub CUDA社区版主,中科院研究生。有两年的CUDA经验。明年毕业,已经被辉达(深圳)半导体有限公司录用。
内容摘要:对于CUDA程序开发来说,优化往往是整个开发过程的核心,不同算法,不同存储器组织的程序性能往往差几十几百倍,本文通过一个简单的例子来展示一些CUDA开发中一些重要的因素对性能的影响。
矩阵转置
block模式
常量存储器使用优化
共享存储器使用优化
warp模式
与cublas比较
很希望能看到风辰老大. 可惜不能去...没时间.... |
|