人工智能訓練
V100 擁有 640 個 Tensor 內(nèi)核,是世界上第一個突破 100 萬億次 (TFLOPS) 深度學習性能障礙的 GPU。新一代 NVIDIA NVLink? 以高達 300 GB/s 的速度連接多個 V100 GPU,在全球打造出功能極其強大的計算服務(wù)器。現(xiàn)在,在之前的系統(tǒng)中需要消耗數(shù)周計算資源的人工智能模型在幾天內(nèi)就可以完成訓練。隨著訓練時間的大幅縮短,人工智能現(xiàn)在可以解決各類新型問題。
人工智能推理
V100 就是為了在現(xiàn)有的超大規(guī)模服務(wù)器機架上提供更高的性能。由于將人工智能作為核心, V100 GPU 可提供比 CPU 服務(wù)器高 30 倍的推理性能。這種吞吐量和效率的大幅提升將使人工智能服務(wù)的擴展變成現(xiàn)實。
高性能計算
V100 的設(shè)計能夠融合人工智能和高性能計算。它為高性能計算系統(tǒng)提供了一個平臺,在用于科學模擬的計算機科學和用于在數(shù)據(jù)中發(fā)現(xiàn)見解的數(shù)據(jù)科學方面表現(xiàn)優(yōu)異。通過在一個統(tǒng)一架構(gòu)內(nèi)搭配使用 NVIDIA CUDA? 內(nèi)核和 Tensor 內(nèi)核,配備 V100 GPU 的單臺服務(wù)器可以取代數(shù)百臺僅配備通用 CPU 的服務(wù)器來處理傳統(tǒng)的高性能計算和人工智能工作負載。現(xiàn)在,每位研究人員和工程師都可以負擔得起使用人工智能超級計算機處理具挑戰(zhàn)性工作的做法。