12
返回列表 发新帖
楼主: azaonline

[有奖问答]_mul24和FMA问题

[复制链接]
论坛徽章:
21
2010新春纪念徽章
日期:2010-03-01 11:08:292012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:25版主3段
日期:2012-05-15 15:24:11马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:12:25
11#
发表于 2010-7-1 19:59 | 只看该作者

回复 #10 azaonline 的帖子

这个,他做的是24位的

使用道具 举报

回复
论坛徽章:
0
12#
发表于 2010-7-1 21:43 | 只看该作者
在ptx一级是已经封装过的ISA,而不是机器上真正执行的指令
ptx里mad指令和mad24指令都有
但是实际硬件并不一定有相应的乘加器

既然tesla架构上整型mad指令都是多条指令模拟的,那么原生的乘加当然更无从谈起了
Fermi上的mul24也是由多条指令模拟的,但是为了ptx前向兼容依然有这条语句

实测tesla架构的32bit整数乘加指令吞吐量是介于乘法和加法之间,而fermi架构上与乘法或者加法相同,就是证明
我没有实际测过mad24的吞吐量,应该是低于mul24或加法的,手册在介绍吞吐量的时候并没有专门列出24bit mad

[ 本帖最后由 NvidiaCTC 于 2010-7-1 21:45 编辑 ]

使用道具 举报

回复
论坛徽章:
0
13#
 楼主| 发表于 2010-7-2 09:59 | 只看该作者
终于搞清楚了。非常感谢

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表