英伟达发布全新GPU加速的计算库CUDA-XAI

机器之心原创

机器之心编辑部

在引领图像计算市场并引领最新一波深度学习浪潮的同时,英伟达也在不断寻求新的突破。在刚刚结束的 GTC 2019 大会上,公司推出了 RTX Server、Data Science Server、Jetson Nano 等新的计算设备以及大量的软件工具,试图将业务扩展到数据科学和超小型物联网设备。

这是英伟达举办的第十届GTC,可惜还是没有期待已久的“安培”架构7nm工艺显卡。

“像所有会议主题演讲一样,我必须为今天的 GTC 演讲想出一个缩写。今天的世界是 – Prada!” 黄仁勋以这样的开场白作了介绍。被命名为 Prada 并不意味着 Nvidia 的显卡已经成为奢侈品。它的意思是:

可编程的

加速度

领域

建筑学

——可编程加速域架构

与 Prada 不同的是,使用 Nvidia 芯片还可以为您节省更多的钱。

作为 GTC 2019 系列的开端,NVIDIA 此次发布了大量重要的新品。

CUDA-X:GPU 加速计算库

会上,黄仁勋发布了全新的GPU加速计算库CUDA-X,捆绑了NVIDIA所有库,解锁了Tensor Core GPU加速的所有灵活性:

数据科学,从数据摄取到 ETL,再到模型训练和用于回归、分类和聚类的机器学习算法的部署所有机器学习训练框架,在此版本中,还可以自动优化 NVIDIA Tensor Core GPU 推理和大规模 Kubernetes 部署个人电脑、工作站、超级计算机云和企业数据中心上的数据科学 亚马逊云服务、谷歌云和微软 Azure 人工智能服务提供商上的数据科学

CUDA-X 加速了数据科学。英伟达今天在 GTC 上推出的 CUDA-X AI 是唯一用于数据科学加速的端到端平台。

随着企业转向人工智能(深度学习、机器学习和数据分析)以使数据更有用,CUDA-X AI 诞生了。所有这些任务的典型工作流程是:数据处理、特征确定、训练、验证和部署。CUDA-X AI 释放了 NVIDIA Tensor Core GPU 的灵活性,以独特的方式解决这种端到端的 AI 工作流程。

CUDA-X AI 能够将机器学习和数据科学工作负载加速 50 倍,并包含十几个专门的加速库。它已经在使用 cuDF 加速数据分析,使用 cuDNN 进行深度学习原语;带有 cuML 的机器学习算法;使用 DALI 等进行数据处理。

总之,这些库加速了典型 AI 工作流程的每一步,无论是使用深度学习来训练语音识别和图像识别系统,还是使用数据分析来评估抵押贷款风险。这些工作流程中的每一步都需要处理大量数据,每一步都受益于 GPU 加速计算。

鼓励创新的软件工具

现场,NVIDIA还发布了Clara AI Toolkit电子计算器上的gt是什么意思,这是一个开放、可扩展的计算平台,使开发人员能够在混合计算环境(嵌入式、本地或云)中构建和部署医学影像应用程序,以创建智能仪器和自动化医疗工作流程. 为了帮助各领域的人工智能研发,Clara 已经拥有许多预训练模型,各行业的开发者可以直接使用,并将其转化为自己的专有工具。Clara 已经被许多医疗机构使用。

如今,有 100 万建筑师、300 万设计师、300 万 3D 设计师和 200 万机械设计师使用 RTX 技术开发产品。许多专业软件也开始支持RTX技术。其中包括 Adob​​e、Autodesk 等。英伟达表示,80% 的行业公司已经支持 RTX 技术。

制作 3D 动画是一个复杂的过程,目前全球有 200 多家动画制作工作室,每个工作室都使用自己的软件和工作风格。NVIDIA 希望通过允许工作室通过统一平台(即 NVIDIA Omniverse)进行协作来提高效率。在GTC上,黄仁勋展示了未来3D动画开发的新流程:Autodesk Maya、Unreal Engine、SUBSTANCE等不同的软件,不同地区的工作室可以在Omniverse上开发模型,所有的进展都是即时可见的。

“Omniverse 可以联合世界各地的 3D 设计工作室,”Jen-Hsun Huang 说。

有的设计师调整模型,有的设计场景,有的修改颜色和纹理。所有工作可以同时完成,大大提高了工作效率。“这是用于 3D 图形的 Google Docs,”黄仁勋说。

面向5G的云服务器

既然是GTC大会,势必会推出新的硬件。随着5G这一低时延无线通信网络的临近,众多软硬件厂商一直倡导的“云流游戏”业务正在逐渐成为现实。英伟达很早就推出了自己的云游戏计划:“GeForce Now”,但由于延迟和带宽问题,目前的游戏体验还没有达到想象中的完美程度。

“GeForce Now拥有30万玩家,500多款游戏,”黄仁勋说。“它不是游戏界的 Netflix,它是在云端计算图像并在本地实时传输图像。” 如果这个想法在不久的将来流行起来,没有强大GPU显卡的玩家可以随时随地玩。有史以来最高质量的游戏。云端游戏在本地流式传输,就像看视频一样,我们即使在手机上也能获得最强的图形体验。

为了满足全球玩家的需求电子计算器上的gt是什么意思,英伟达设立了15个数据中心来提供计算能力。但这对于云游戏服务来说还不够。NVIDIA 提出 Geforce Now 联盟,邀请更多公司提供自己的计算能力,加入支持 GeForce Now 的行列。软银和 LG U+ 在第一阶段加入。

有了伙伴,如何保证服务器的效率?Nvidia还推出了RTX Server来保证计算能力。

图片[1]-英伟达发布全新GPU加速的计算库CUDA-XAI-老王博客

这是一个强大的服务器设计,可以在8U空间内容纳40个图灵架构GPU(GeForce RTX 2080)),整个服务器系统可以在10个机架中集成32个RTX服务器,计算能力高达1280个GPU空间中提供了Mellanox技术,实现服务器之间的高速连接。一个 RTX Server 系统可以提供多达 10,000 名玩家同时玩游戏。

英伟达表示,8U RTX 服务器将于今年第三季度出货。

黄仁勋:越买越省?现在错了,使用 RTX 服务器,五年后您将节省与免费服务器一样多的电力!

“数据科学是目前发展最快的科学。” 黄仁勋表示,英伟达这次在“超级计算”和“超大规模”之间找到了一个新的行业痛点“数据科学”。这是一个对并行计算效率要求很高,需要大量计算能力的领域。新推出的 RTX Server 和之前提出的 DGX-2 适合该领域的需求。

最小的人工智能计算机:Jetson Nano

GTC上没有芯片是不可想象的,这次NVIDIA在上届发布会上发布了最小的产品,正如它的名字:Jetson Nano。

在今天的 GTC 大会上,Jen-Hsun Huang 宣布了 Jetson Nano 的两个版本:面向开发人员和爱好者的 99 美元开发套件;以及面向公司的 129 美元产品模块。NVIDIA Jetson 系列有一个新成员,现在包括用于自动驾驶的 Jetson AGX Xavier 和用于边缘 AI 的 Jetson TX2。

Jetson Nano 及其开发板。

据黄仁勋介绍,Jetson Nano 是一台人工智能计算机,能够创建数百万个智能系统。这款小巧但功能强大的 CUDA-X AI 计算机可提供 472 Gb 的计算性能,用于运行现代 AI 工作流程。它非常节能,功耗低至 5 瓦。Jetson Nano 开发板包含 4 核 A57CPU、128 核 Maxwell 架构 GPU 和 4G 内存。它似乎比 Raspberry Pi 3 性能更好。

Jetson Nano 支持高清传感器,可以并行处理多个传感器,并在每个传感器流上运行多个现有的神经网络。它还支持许多流行的 AI 框架,使开发人员可以轻松地将自己喜欢的模型和框架集成到产品中。该开发套件开箱即用地运行 Linux,并具有 4GB 的 RAM 以及相机和其他配件所需的 I/O。

Jetson Nano 开发者套件技术规格

根据 NVIDIA 博客,Jetson Nano 可以运行广泛的网络,包括 TensorFlow、PyTorch、Caffe/Caffe2、Keras、MXNet 等流行机器学习框架的完整原生版本。通过启用图像识别、对象检测和定位、人体姿态估计、语义分割、视频增强和智能分析等功能,这些网络可用于构建自动驾驶机器和复杂的人工智能系统。

下图显示了各种流行模型的推理基准测试结果。Jetson Nano 在很多场景下都实现了实时性能,能够处理多个高清视频流。

Jetson Nano 和 TensorRT 下各种深度学习推理网络的性能,使用 FP16 精度和 1 的批大小。

此外,英伟达将 Jetson Nano 与 Raspberry Pi、英特尔的 Compute Stick 和谷歌的 Edge TPU 开发版进行了比较,部分结果如下。

Jetson Nano 的推理性能与 Raspberry Pi、英特尔的 Compute Stick 和 Google 的 Edge TPU 开发版相比

更自由的自动驾驶

除了开发板,英伟达芯片还渗透到各行各业的机器人领域,为人工智能算法提供端到端的算力支持,但计算成本最高的是自动驾驶。“最重要的机器人是自动驾驶汽车,”黄仁勋说。

目前,英伟达已经开放了覆盖整个自动驾驶过程的开发工具。许多汽车制造商、自动驾驶技术公司、高清地图和传感器制造商都加入了这个生态系统。

在现场,英伟达展示了最新的自动驾驶汽车演示视频。黄仁勋表示,去年英伟达的自动驾驶汽车是在闭环路线上运行,而今天的自动驾驶汽车已经可以生成动态地图并自动驾驶。“即使在地图上没有标出的支路,我们的自动驾驶汽车也可以通过激光雷达、雷达、摄像头等传感器自动生成高精度地图,并安全行驶。” 黄仁勋说道。

在英伟达的设想中,道路规划+预测+强制安全区域的逻辑可以预测自动驾驶过程中未来道路上会出现的各种情况,从而保证自动驾驶的安全。当然,这些算法很快就会开源。

在 GTC 上,英伟达发布了自动驾驶模拟器 Drive Constellation,这是一个复杂的虚拟场景,供开发人员在更真实的场景中训练自动驾驶 AI 模型。开发者可以自由控制天气、道路交通状况,随意切换控制车辆。这种方法比现实世界更有效、更经济、更安全。

英伟达驱动星座

在去年的 GTC 上首次推出 Drive Constellation,这是一种由两个并排服务器组成的数据中心解决方案: DRIVE Con​​stellation Simulator 使用运行 DRIVE Sim 软件的 NVIDIA GPU 为虚拟世界中的汽车生成传感器输出;DRIVE Con​​stellation Vehicle 包含 DRIVE AGX Pegasus AI 车载电脑,用于处理模拟传感器数据。

英伟达表示,此类模拟器不仅将帮助自动驾驶开发者,还将成为第三方监管机制的重要组成部分。会上,黄仁勋还公布了英伟达的第一个合作伙伴:全球第一汽车制造商丰田。

从英伟达2018年第四季度财报来看,其RTX20系列显卡带来的收益并不理想。虽然 AMD 在 1 月份推出了自己的 7nm 工艺 CPU 和 GPU,但 Nvidia 似乎并不感到紧迫。目前,英伟达希望开拓新市场,让更多行业使用最先进的人工智能技术。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论