十年磨一剑:英伟达最「闪」GPU 登场,揭晓新一代芯片架构图灵

从今年年初开始,英伟达将发布新一代架构的消息就已经传的沸沸扬扬,传闻称架构代号也许会是「Ampere」,也可能是「Turing」。苦等半年,今日新一代的 Quadro(英伟达绘图系列)芯片架构最终揭晓:图灵。在今早 SIGGRAPH 大会上,英伟达创始人兼首席执行官黄仁勋在其主题演讲上发布了这一新架构,除此之外还推出了全新的 RTX 系列 GPU。

撰文 | Tony  Peng (彭君韬),人工智能站海外团队

作为计算机图形领域的顶会,SIGGRAPH 汇集了多媒体、交互和动画界的前沿研究人员。作为图像处理界的大佬,英伟达和黄仁勋几乎每年都会来 SIGGRAPH 推销一下自家的新卡,今年也不例外。

当老黄从工作人员手上接过即将发布的新 GPU 时,底下的观众觉得有点不对劲儿——这款芯片太闪了。灯光反射在 GPU 的表面外壳上,照着底下的观众和摄影师们都快睁不开眼。

老黄在舞台上不断地打趣:

「这张卡上的反光真是做得完美无缺!」

「漂亮吗,你不觉得它长的很漂亮吗?!」

「事实证明,这是原力啊!(老黄也是星球大战粉)」

老黄当然不是外表协会。如果空有一副皮囊,这块新卡又怎么能被称为是「英伟达 2006 年以来最大的一次飞跃呢?」

闪耀的新卡:RTX

在今年三月硅谷举办的 GDC 大会上,老黄推出了 RTX 技术,即所谓的「光线跟踪」,可以为内容创作者和游戏开发者提供实时、达到电影质量的画面渲染。

在今天的发布会上,老黄重新播放了 5 个月前的演示视频:两个背地里说黑武士坏话的帝国风暴兵被罚到雪地里站岗。对啊,还有什么比渲染出黑武士身上那副盔甲更好的演示视频呢?

RTX 技术在当下技惊四座,每 pixel 可以跑 5 次光线追踪,但重头戏却留到了今天才揭晓: 英伟达其实只用了一块 GPU 来支持视觉渲染的算力!

这就是今天英伟达在 SIGGRAPH 上推出的 Quadrio RTX GPU,也是世界上首款实现光线跟踪的 GPU。

「RTX 是自 2006 年(G80/Tesla)以来英伟达推出的最重要的一块 GPU。」

老黄一句话,给这块新卡先定下了个基调。

再来看下这块卡的参数:

  • 最高每秒 10 GigaRays 的光线跟踪;

  • 峰值 16 TFlops;

  • 每秒 500 万亿张量运算;

  • NVLink 技术提供 100GB/s 的带宽;

全新 Quadro 架构图灵,添加 AI 功能

伴随着 RTX 的出炉,英伟达也引出了 Quadro 的新一代架构——Turing(图灵)。

历经英伟达十年的打磨,Turing 架构相比于 Quadro 过去的架构 Pascal,在 Shader Compute 的基础上增加了具备 AI 训练和推理能力的 Tensor Core 和支持光线跟踪的 RT Core。

Tensor Core 在半精度浮点数 FP16 下提供 128 TFlops 的算力,Int8 精度下为 250 Tops,Int4 精度下为 500 Tops。

RT Core 则是首次亮相,与 Pascal 架构相比,新的 RT Core 可以将光线跟踪的速度提高至 25 倍。

RTX 系列芯片拥有 4,608 个 CUDA 核心,可同时提供高达 16 万亿次浮点运算和每秒 16 万亿次整数运算。RTX 系列具有 16 GB GDDR6 内存以加速发展,内存容量可以扩展至 96 GB。

老黄现场演示了新卡的视觉渲染能力:在相同的物理材料和灯光下,基于 Turing 架构的 RTX 可以实现包括区域光、全局照明、反射、折射、景深、漫反射、焦散等视觉效果。

话不多说直接上图:上图是用传统处理器(没有明细是哪一款)添加的区域光,下图是用 Turing 架构下的效果,效果泾渭分明。

再看这辆对保时捷的渲染:(老黄说了,所有演示的渲染都是实时的,英伟达不耍虚招)

新架构相比于 Pascal 在视觉渲染上提升了 6 倍的速度。这种提升除了归功于光线跟踪技术和更好的着色效果外,英伟达还引入了一项新技术——Deep Learning Anti-Aliasing(DLAA)基于深度学习抗锯齿算法。简单来说,DLAA 可以利用深度学习算法来消除较低分辨率的渲染,然后消除锯齿从而获得更高的图像质量。

和硬件配套,英伟达同时推出了一个全栈的软件平台 NVIDIA RTX,将渲染技术和 AI 能力、算力等结合。

该平台还将开源 NVIDIA 材料定义语言(MDL),这是一种用于定义基于物理的渲染材料的编程语言;也将支持 Pixar 上的通用场景描述(USD)语言。

英伟达相信,Turing 能够启发价值 2500 亿美元的视觉效果市场,包括设计、数字内容创作(DEC)、建筑/工程/施工项目(AEC)、可视化、和电影电视等传统媒介。

两千刀你买不了上当

所以,芯片最后多少钱呢?

RTX 系列将会有三名成员:RTX 5000/RTX 6000/RTX 8000。

基本款 RTX5000,16 GB 内存,每秒 6 gigarays,售价 2,300 美金。

进阶款 RTX6000,24 GB 内存,每秒 10 gigarays,售价 6,300 美金。

高级款 RTX8000,48 GB 内存,每秒 10 gigarays,售价 10,000 美金。

如果你想要搭建一套渲染农场,英伟达秉持着「多买多省」的原则,推出了 Quadro RTX Server—8 块 RTX 8000,配合最新的 Quadro Infinity 软件,将在 2019 年第一季度推出,售价$125,000。

Quadro RTX Server 预装了内容创建和渲染软件,提供功能强大且易于部署的渲染解决方案,可从小型安装扩展到最大的数据中心,仅占 CPU 渲染农场成本的四分之一,空间减至十分之一,能耗十一分之一。

新品上架,自然引发哄抢。老黄也晒出了英伟达的朋友圈:Adobe、Autodesk、西门子 NX、DavinciResolve 等 20 家科技新贵、工作室和制作公司都已经购买了 RTX 的新卡和服务器。

靠图形处理发家,靠 AI 卖卡致富,25 岁的英伟达正在走向第三个阶段:AI 赋能底层。配备针对机器学习的算力,重构图形处理器的架构。

GPU 的全面 AI 化,是否也指日可待呢?

入门 英伟达 芯片
2