SexInSex! Board » IT新闻科技最前线(关闭) » 简化并行开发 NVIDIA宣布CUDA 4.0[8P]

查看完整版本: 简化并行开发 NVIDIA宣布CUDA 4.0[8P]

kimi25 2011-2-28 23:15

简化并行开发 NVIDIA宣布CUDA 4.0[8P]

NVIDIA公司今天宣布了新版GPU通用计算开发包CUDA 4.0，主要改进方向是简化并行编程，让更多开发人员能够将应用程序移植到GPU平台。
CUDA 4.0的三大主要特性包括：
[img=550,309]http://news.mydrivers.com/Img/20110228/S05541945.jpg[/img]
[b]GPUDirect 2.0技术[/b]。GPUDirect 1.0主要用于高性能计算集群应用，方便不同节点之间的GPU相互联系，而GPUDirect 2.0则面向节点内应用，即多GPU并联系统。同一节点内的多块GPU可以不经过CPU、住内存，直接交换各自显存中的数据。
[img]http://news.mydrivers.com/Img/20110228/S05544420.jpg[/img]
[img]http://news.mydrivers.com/Img/20110228/S05544444.jpg[/img]
[img]http://news.mydrivers.com/Img/20110228/S05544464.jpg[/img]
[b]统一虚拟寻址(UVA)[/b]。简化通用计算编程中的寻址空间设计，开发者不需要再考虑CPU和各个GPU各自的内存空间，而是整合为一个统一的内存寻址空间，大大简化并行编程。
[img]http://news.mydrivers.com/Img/20110228/S05544483.jpg[/img]
[b]Thrust C++模板高性能基元库[/b]。能够提供一系列开源C++并行算法和数据结构，这些内容能够让C++开发人员更轻松的使用CUDA编程。与使用标准模板库(STL)以及线程构件(TBB)时相比，Thrust中并行排序等算法的速度可提升5至100倍。
[img]http://news.mydrivers.com/Img/20110228/S05544505.jpg[/img]
除此之外，CUDA 4.0的新特性还包括:
- MPI与CUDA应用程序相结合。当应用程序发出MPI收发调用指令时，例如OpenMPI等MPI软件可通过Infiniband接口自动收发显卡显存数据。
- GPU多线程共享。多个CPU主线程能够在一颗GPU上共享运行环境。
- 单CPU线程共享多GPU。一个CPU主线程可以访问系统内的所有GPU。
- 全新的NPP图像与计算机视觉库。
- 新增、改良的功能
  Visual Profiler中的自动性能分析功能
  Cuda-gdb中的新特性以及新增了对Mac OS的支持
  新增了对C++特性的支持，这些特性包括新建/删除以及虚拟等功能
  新版GPU二进制反汇编程序
CUDA 4.0在硬件上需要Fermi架构GPU才能够提供完整支持，操作系统方面则仍然支持Windows、Mac OS X、Linux等系统。3月4日其，CUDA注册开发者计划会员将可以免费下载CUDA Tool Kit 4.0 RC发布候选版。
[img]http://news.mydrivers.com/Img/20110228/S05554900.jpg[/img]
[img]http://news.mydrivers.com/Img/20110228/S05554923.jpg[/img]

[[i] 本帖最后由 kimi25 于 2011-2-28 23:18 编辑 [/i]]

LeiNuo 2011-3-1 11:40

整合gpu?不知道n卡的gpu什么时候能和cpu整合了

reackqiu 2011-3-2 21:48

我用的是a卡，找个支持stream技术的压缩软件都难，郁闷

forme 2011-3-2 22:16

纯技术贴,仔细学习下,这种行为导致的后果确实很难预料.

zjw881116 2011-3-2 22:55

科技发展的真得太快了，很多东西还没有研究过，就又有新的了

universitygjq 2011-3-3 21:11

看不懂。凑个热闹。不管怎么搞。能方便大众的我们都支持。

revisttt 2011-3-3 21:21

nvidia的发展史可以当作一部it教学书了，实在很有硅谷特色。

wwwaptx 2011-3-4 23:10

不错，NV是GPU想干CPU的活儿，而Intel的CPU又集合了GPU，都想把对方的市场吃掉啊。

页: [1]

查看完整版本: 简化并行开发 NVIDIA宣布CUDA 4.0[8P]