123
返回列表 发新帖
楼主: hxaccker

[求助] 关于高斯消元法求线形方程组问题

[复制链接]
论坛徽章:
20
2010新春纪念徽章
日期:2010-03-01 11:20:002012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:25版主1段
日期:2012-05-15 15:24:11马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:12:25
21#
发表于 2010-7-31 09:05 | 只看该作者
我的实现即使在考虑算法的整个时间(包括将源数据从主机内存拷贝到设备内存,计算完后再从设备内存拷回主机内存),在GTX285上的加速比也有大约315倍的加速比(规模4096x4096,对标准的CPU算法进行了改进和优化并开启了O2优化(最大化速度)),即使考虑CPU用SIMD指令集进行加速也有两个数量级以上的加速比。
即是按照标准的高斯消元过程,那么效率也不会有太大的差别。

[ 本帖最后由 cyrosly 于 2010-7-31 10:27 编辑 ]

使用道具 举报

回复
论坛徽章:
0
22#
 楼主| 发表于 2010-8-2 13:21 | 只看该作者

回复 #20 cyrosly 的帖子

LU分解本身就是高斯消元,cholesky分解在我的理解下只能分解正定矩阵的,不知你那个是什么cholesky分解,且分解了还不够,要最终方程的解,时间不止是算分解的时间。

[ 本帖最后由 hxaccker 于 2010-8-2 13:27 编辑 ]

使用道具 举报

回复
论坛徽章:
0
23#
 楼主| 发表于 2010-8-2 13:26 | 只看该作者

回复 #21 cyrosly 的帖子

你们还是没告诉我自己的算法是怎么分配任务啊,我就是想问这个任务具体是怎么分配的,具体怎么分配到block,不然在这问问题没意义啊,知道了你们的算法有多少加速比有什么意义?不解决问题啊。

使用道具 举报

回复
论坛徽章:
20
2010新春纪念徽章
日期:2010-03-01 11:20:002012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:25版主1段
日期:2012-05-15 15:24:11马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:12:25
24#
发表于 2010-8-3 09:43 | 只看该作者
原帖由 hxaccker 于 2010-8-2 13:21 发表
LU分解本身就是高斯消元,cholesky分解在我的理解下只能分解正定矩阵的,不知你那个是什么cholesky分解,且分解了还不够,要最终方程的解,时间不止是算分解的时间。

LU分解本身就是高斯消元,cholesky分解在我的理解下只能分解正定矩阵的,不知你那个是什么cholesky分解,且分解了还不够,要最终方程的解,时间不止是算分解的时间。

是,没错,这个我比你清楚。C和LU分解我都做过。但是LU分解如果不考虑选主元(理论上计算量大约是cholesky分解的2倍,但在CUDA架构下实际上不会)不会比CL分解慢多少。至于分解后的并行求解两个三角方程,我早就做过了,也早就发表在我的博客上,另外前段时间的IT168的小比赛就有这个题目我也做了,加速比很好。而求解几乎不会影响分解部分的加速比。谢谢

使用道具 举报

回复
论坛徽章:
20
2010新春纪念徽章
日期:2010-03-01 11:20:002012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:25版主1段
日期:2012-05-15 15:24:11马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:12:25
25#
发表于 2010-8-3 09:44 | 只看该作者
原帖由 hxaccker 于 2010-8-2 13:26 发表
你们还是没告诉我自己的算法是怎么分配任务啊,我就是想问这个任务具体是怎么分配的,具体怎么分配到block,不然在这问问题没意义啊,知道了你们的算法有多少加速比有什么意义?不解决问题啊。


怎么实施的方法我早就在CSDN上说过了,自己去找吧

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表