楼主: 图腾部落

CUDA第四期有奖讨论:谈谈你对CUDA的架构的理解(活动已结束)

[复制链接]
论坛徽章:
102
41#
发表于 2010-1-5 13:35 | 只看该作者
顶一下,学习

使用道具 举报

回复
论坛徽章:
57
指数菠菜纪念章
日期:2015-04-02 09:22:46股神
日期:2015-04-02 09:23:14
42#
发表于 2010-1-5 15:17 | 只看该作者
跟顶,学习,学习,再学习

使用道具 举报

回复
论坛徽章:
2
2012新春纪念徽章
日期:2012-01-04 11:55:42ITPUB社区12周年站庆徽章
日期:2013-10-08 14:59:19
43#
发表于 2010-1-5 15:20 | 只看该作者
Cyberlink近日宣布他们正在为其Power Director 7增加对CUDA计算架构的支持。Elitebastards进行了一些测试来观察其性能是否有重大改善。
“在好几个测试当中,GPU的使用使得速度提高了20-30%,在产生万花筒和“钢笔墨水”效果等其他一些运算更为密集的测试中,GPU使速度提高了60%。如果采用我们的特别配置,将大大节省时间。”

  CUDA计算架构已经被业界广泛采用,而且在folding@home、Cyberlink PowerDirector 7、Badaboom和TMPGEnc 4.0 Xpress等实际应用中使性能得到了极大的提高。更多的性能改善将在不远的将来一一实现。务必让你的下一个GPU能够支持CUDA。它应该具备绝佳的图形效果和其他一些有用的特性
OpenCL的面世,不管对开发人员还是业界人员来说还是消费者来说都是一个非常好的API,它可以使得开发者很容易的开发出跨平台的GPU计算的程序,充分利用GPU强大的计算能力然后应用在各种各样计算的方面。 除了CUDA的架构上除了C语言以外,现在新增加了OpenCL或者DX11这样的API,对于开发人员来说也提供了一种更多的GPU计算的开发环境的一种选择。如果对API很熟悉的程序员,肯定会很高兴的看到OpenCL或者新的API的加入,对于这些人来说他们很容易利用这种计算的API然后开发各种各样GPU计算的程序。NVIDIA也会继续对C语言包括其他语言的支持,实对NVIDIA CUDA C语言来说目前还是唯一的针对GPU的runtime C的语言环境(runtime C的语言环境是指GPU直接执行这个C语言)。CUDA C语言还会进一步的发展,不断会有新的版本推出。CUDA C语言会和OpenCL和DX11这种计算API会共存。除了C语言以外NVIDIA还会推出更多的其他CUDA的语言,包括Fortran,还会有Java等。不管C语言还是Fortran,与OpenCL、Computer shader这种API是一种长期共存的关系。 GPU通用计算时代已经到来了!
以上引用:OpenCL与CUDA架构深入解析

使用道具 举报

回复
论坛徽章:
211
白羊座
日期:2016-03-22 08:17:34青年奥林匹克运动会-三人篮球
日期:2014-09-15 02:28:46青年奥林匹克运动会-射箭
日期:2014-09-15 01:42:34青年奥林匹克运动会-帆船
日期:2014-09-13 08:58:09青年奥林匹克运动会-三人篮球
日期:2014-09-13 05:28:31青年奥林匹克运动会-三人篮球
日期:2014-09-12 19:37:47青年奥林匹克运动会-手球
日期:2014-09-12 17:22:08青年奥林匹克运动会-拳击
日期:2014-09-10 06:22:35青年奥林匹克运动会-游泳
日期:2014-09-09 18:51:21青年奥林匹克运动会-手球
日期:2014-09-09 18:35:15
44#
发表于 2010-1-5 17:14 | 只看该作者
跟顶,学习,学习,再学习

使用道具 举报

回复
论坛徽章:
211
白羊座
日期:2016-03-22 08:17:34青年奥林匹克运动会-三人篮球
日期:2014-09-15 02:28:46青年奥林匹克运动会-射箭
日期:2014-09-15 01:42:34青年奥林匹克运动会-帆船
日期:2014-09-13 08:58:09青年奥林匹克运动会-三人篮球
日期:2014-09-13 05:28:31青年奥林匹克运动会-三人篮球
日期:2014-09-12 19:37:47青年奥林匹克运动会-手球
日期:2014-09-12 17:22:08青年奥林匹克运动会-拳击
日期:2014-09-10 06:22:35青年奥林匹克运动会-游泳
日期:2014-09-09 18:51:21青年奥林匹克运动会-手球
日期:2014-09-09 18:35:15
45#
发表于 2010-1-5 17:26 | 只看该作者
跟顶,学习,学习,再学习

使用道具 举报

回复
论坛徽章:
21
2010新春纪念徽章
日期:2010-03-01 11:08:292012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:25版主3段
日期:2012-05-15 15:24:11马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:12:25
46#
发表于 2010-1-5 22:24 | 只看该作者

回复 #52 OpenGPU 的帖子

无论多么简单的语言,编写出来的代码,质量和效率都是有差别的。

使用道具 举报

回复
论坛徽章:
21
2010新春纪念徽章
日期:2010-03-01 11:08:292012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:252012新春纪念徽章
日期:2012-02-13 15:12:25版主3段
日期:2012-05-15 15:24:11马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:12:25
47#
发表于 2010-1-5 22:26 | 只看该作者
本来一直都想把自己对CUDA架构的理解写出来,但是一方面自己是个懒人,不太愿意动笔,另一方面又感觉不太好组织语言,今天终于借着这个第四期有奖讨论的机会,把我对CUDA 架构的理解写下来吧!

    至于题目中提到的有人将CUDA架构和x86的一样理解,这一定是错误的,如果说把GPU的架构和x86架构类比,这还有点道理。

        要理解CUDA架构,个人认为应当先理解CUDA,CUDA是compute unit device architecture的简称,它统一了NVIDIA用于通用计算的GPU的编程模式,同时引入的共享存储器也是一大特色,大大提高了速度。有时我们说CUDA是指软件,有时又是指硬件,更多时是指CUDA C语言,因此本文将分三个部分简略的说明。

        从软件的角度上说,CUDA软件栈包含两个层次,一个是驱动层的API,这类函数以cu开关,一个是运行层的API,以cuda开头,运行层API是建立在驱动层API之上的,是对驱动层API的封装,这种封装方便了使用,但是同时也牺牲了灵活性。一般而言,我们的开发都是优先使用运行时API。要提到的是:NVIDIA自身也提供了一些建立在这两者之上的库,供大家使用。

从另外一个方面说,CUDA的软件架构也应当包含这一系列的语言支持。当然这只是个人观点,欢迎大家讨论。

        从硬件的角度看,CUDA架构应当包含TPC-->SM-->SP结构及它们的关系。各种存储器及其组织,以及硬件对线程的创建、执行、调度等,本人博客将会专门细说这个问题,所以也就不详细说了。

        从CUDA C语言的角度看,CUDA的架构包括函数修饰符,变量修饰符,以及一些内置函数等,这方面内容本人的博客将会详细说明,因此,此处就不多说了。

使用道具 举报

回复
论坛徽章:
2
2010新春纪念徽章
日期:2010-03-01 11:08:292011新春纪念徽章
日期:2011-02-18 11:43:33
48#
发表于 2010-1-6 15:31 | 只看该作者

回复 #50 OpenGPU 的帖子

有3.0的手册?

使用道具 举报

回复
论坛徽章:
1
2011新春纪念徽章
日期:2011-02-18 11:42:48
49#
发表于 2010-1-6 21:55 | 只看该作者
Fermi通过处理各种各样的计算应用程序,使GPU(图形处理器)与CPU协同处理能够得到广泛应用。Fermi专为C++而设计并附带Visual Studio开发环境,它让并行编程工作变得更加轻松并可加速各种各样的应用程序性能,其覆盖的应用程序范围比以往任何一款架构都更加广泛。Fermi可在光线追踪、物理效果、有限元分析、高精度科学计算、稀疏线性代数、排序以及搜索算法等领域中大幅提升性能。

Fermi包含多项重大创新:
• 512个CUDA核心
• NVIDIA®(英伟达™)并行数据缓存(Parallel DataCache™)技术
• NVIDIA®(英伟达™)GigaThread™ 3.0引擎
• 完全支持ECC

使用道具 举报

回复
论坛徽章:
0
50#
发表于 2010-1-6 21:59 | 只看该作者
CUDA(Compute Unified Device Architecture),显卡厂商NVidia推出的运算平台。
要理解CUDA架构,个人认为应当先理解CUDA,CUDA是compute unit device architecture的简称,它统一了NVIDIA用于通用计算的GPU的编程模式,同时引入的共享存储器也是一大特色,大大提高了速度。有时我们说CUDA是指软件,有时又是指硬件,更多时是指CUDA C语言,
从软件的角度上说,CUDA软件栈包含两个层次,一个是驱动层的API,这类函数以cu开关,一个是运行层的API,以cuda开头,运行层API是建立在驱动层API之上的,是对驱动层API的封装,这种封装方便了使用,但是同时也牺牲了灵活性。一般而言,我们的开发都是优先使用运行时API。
从硬件的角度看,CUDA架构应当包含TPC-->SM-->SP结构及它们的关系。各种存储器及其组织,以及硬件对线程的创建、执行、调度等.
CUDA C语言的角度看,CUDA的架构包括函数修饰符,变量修饰符,以及一些内置函数等.

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表