|
在ptx一级是已经封装过的ISA,而不是机器上真正执行的指令
ptx里mad指令和mad24指令都有
但是实际硬件并不一定有相应的乘加器
既然tesla架构上整型mad指令都是多条指令模拟的,那么原生的乘加当然更无从谈起了
Fermi上的mul24也是由多条指令模拟的,但是为了ptx前向兼容依然有这条语句
实测tesla架构的32bit整数乘加指令吞吐量是介于乘法和加法之间,而fermi架构上与乘法或者加法相同,就是证明
我没有实际测过mad24的吞吐量,应该是低于mul24或加法的,手册在介绍吞吐量的时候并没有专门列出24bit mad
[ 本帖最后由 NvidiaCTC 于 2010-7-1 21:45 编辑 ] |
|