通用计算、异构计算、协同计算、边缘计算等多元产品布局
NVIDIA A10 Tensor Core GPU 与 NVIDIA RTX 虚拟工作站 (vWS) 软件相结合,将主流图形和视频与 AI 服务引入主流企业服务器,为设计师、工程师、艺术家和科学家带来应对当今挑战所需的解决方案。A10 基于最新的 NVIDIA Ampere 架构而构建,将第二代 RT Core、第三代 Tensor Core 和新型流式传输微处理器与 24 GB 的 GDDR6 显存相结合 (皆在 150W 功率范围内),实现通用的图形、渲染、AI 和计算性能。从可在世界各地访问的虚拟工作站、渲染节点, 到运行各种工作负载的数据中心,A10 皆能以单宽、全高、全长 PCIe 外形提供出色性能。 NVIDIA A10 支持作为 NVIDIA-Certified Systems™ 的一部分,在本地数据中心、云和边缘中使用。
NVIDIA A10 基于由 NVIDIA NGC™ 目录、CUDA-X™ 库、超过 230 万名开发者和 1800 多个 GPU 优化应用程序组成的丰富的 AI 框架生态系统而构建,帮助企业应对其业务中的关键挑战。
速度提升一倍的单精度浮点 (FP32) 运算处理和改善的能效可显著提高图形和计算工作流程的性能,例如复杂的 3D 计算机辅助设计 (CAD) 和计算机辅助工程 (CAE)。
凭借高达 2 倍于上一代产品的吞吐量,以及并行运行光线追踪与着色或降噪功能的能力,第二代 RT Core 可大幅加快电影内容的逼真渲染、建筑设计评估以及产品设计的虚拟原型制作等工作负载的运行速度。这项技术还可提升光线追踪动态模糊的渲染速度,从而更快获得结果,并增加视觉准确度。
Tensor Float 32 (TF32) 精度提供的训练吞吐量高达上一代的 5 倍,而且无需更改代码即可加速 AI 和数据科学模型的训练。从硬件上支持结构化稀疏使推理吞吐量提升一倍。Tensor Core 还为图形处理引入了诸多 AI 功能,例如为选定应用程序带来了深度学习超级采样 (DLSS)、AI 降噪和增强编辑等功能。
超高速 GDDR6 显存,为渲染、数据科学、工程模拟和其他 GPU 显存密集型工作负载提供 600 GB/s 带宽。
PCI Express 4.0 提供的带宽比 PCIe Gen 3 多一倍,提高了 CPU内存的数据传输速度,从而可以更快地处理 AI、数据科学和 3D 设计等数据密集型任务。更快的 PCIe 性能还能加速 GPU 直接显存访问 (DMA) 传输,这在 GPU 与支持 NVIDIA GPUDirect® for Video 的设备之间提供了更快的视频数据输入/输出通信速度,从而带来强大的直播解决方案。 A10 还向后兼容 PCI Express 3.0,这提供了部署灵活性。
NVIDIA A10 采用单插槽、全高、全长节能设计,可兼容全球 OEM 供应商生产的各式服务器。 NVIDIA A10 包含通过硬件信任根技术进行安全可靠的引导,确保固件不会被篡改或损坏。
A10 技术规格和功能 | |
---|---|
FP32 | 31.2 兆次浮点运算 |
TF32 Tensor 核心 | 62.5 兆次浮点运算 | 125 兆次浮点运算* |
BFLOAT16 Tensor 核心 | 125 兆次浮点运算 | 250 兆次浮点运算* |
FP16 Tensor 核心 | 125 兆次浮点运算 | 250 兆次浮点运算* |
INT8 Tensor 核心 | 250 兆次浮点运算 | 500 兆次浮点运算* |
INT4 Tensor 核心 | 500 兆次浮点运算 | 1,000 兆次浮点运算* |
RT 核心 | 72 个 RT 核心 |
编码/译码 | 1 个编码器 2 个译码器 (+AV1 解码) |
GPU 内存 | 24GB GDDR6 |
GPU 内存带宽 | 每秒 600 GB |
互连技术 | 第四代 PCIe 64GB/秒 |
尺寸规格 | 单插槽、全高全长尺寸 (FHFL) |
最大散热设计功耗 (TDP) | 150W |
虚拟化 GPU 软件支持 | NVIDIA 虚拟 PC、NVIDIA 虚拟应用程序、NVIDIA RTX 虚拟化工作站、NVIDIA 虚拟化运算服务器 |