微軟 Azure ND H100 v5 VM 虛擬機(jī)預(yù)覽發(fā)布：采用 8 至上千個(gè) NVIDIA H100 Tensor Core GPU

2023-04-14 21:33:12|

來源：IT之家作者：

IT之家 4 月 14 日消息，據(jù)微軟 Azure 官方發(fā)布，微軟將過去十年的超級計(jì)算經(jīng)驗(yàn)和支持超大型 AI 訓(xùn)練工作負(fù)載的經(jīng)驗(yàn)應(yīng)用于搭建具備大規(guī)?；咝阅艿?AI 基礎(chǔ)架構(gòu)。微軟 Azure 智能云，特別是以圖形處理單元（GPU）加速的虛擬機(jī)（VM），為微軟及其客戶的生成式 AI 發(fā)展奠定了基礎(chǔ)。

【資料圖】

微軟現(xiàn)推出 ND H100 v5 VM，是 Azure 迄今更強(qiáng)大和高度可伸縮的 AI 虛擬機(jī)系列。該虛擬機(jī)支持的按需配置可達(dá) 8 至上千個(gè)通過 Quantum-2 InfiniBand 網(wǎng)絡(luò)互連的 NVIDIA H100 GPU，使得 AI 模型的性能明顯提高。相較上一代 ND A100 v4 VM，本次推出的虛擬機(jī)包含以下創(chuàng)新技術(shù)：

8 塊 NVIDIA H100 Tensor Core GPU，通過下一代 NV Switch 和 NV Link 4.0 互連。

在無阻塞胖樹網(wǎng)絡(luò)中，每個(gè) GPU 搭載 400 Gb / s NVIDIA Quantum-2 CX7 InfiniBand 和每 VM 3.2Tb / s 的性能。

每個(gè) VM 中的 8 塊本地 GPUs 之間通過 3.8Tb / s 對分割帶寬的 NV Switch 和 NV Link 4.0 互聯(lián)。

第四代英特爾至強(qiáng)可擴(kuò)展處理器。

PCIE 第 5 代主機(jī)到 GPU 互連，每個(gè) GPU 帶寬為 64Gb / s。

16 信道的 4800 MHz DDR5 內(nèi)存。

IT之家注：NVIDIA Quantum-2 采用第七代 NVIDIA InfiniBand 架構(gòu)，可為 AI 開發(fā)者和科學(xué)研究人員提供超強(qiáng)網(wǎng)絡(luò)性能和豐富功能，幫助他們解決充滿挑戰(zhàn)性的問題。NVIDIA Quantum-2 通過軟件定義網(wǎng)絡(luò)、網(wǎng)絡(luò)計(jì)算、性能隔離、高級加速引擎、遠(yuǎn)程直接內(nèi)存訪問 (RDMA) 以及高達(dá) 400 Gb / s 的超快的速度，為先進(jìn)的超級計(jì)算數(shù)據(jù)中心提供助力。

微軟表示，大規(guī)模 AI 已內(nèi)置于 Azure 的 DNA 中。對大型語言模型研究（如圖靈）的初始投資，以及諸如在云中構(gòu)建第一臺 AI 超級計(jì)算機(jī)等里程碑，都為生成式 AI 的問世做好了充分準(zhǔn)備。Azure 機(jī)器學(xué)習(xí)等 Azure 服務(wù)使客戶能夠訪問 AI 超級計(jì)算機(jī)，以進(jìn)行模型訓(xùn)練。Azure OpenAI 服務(wù)使客戶能夠利用大規(guī)模生成式 AI 模型的強(qiáng)大功能。「規(guī)?！挂恢笔?Azure 優(yōu)化 AI 基礎(chǔ)設(shè)施的目標(biāo)之一。現(xiàn)在，微軟正為各種規(guī)模的初創(chuàng)公司和企業(yè)帶來無需大量物理硬件或軟件投入的超級計(jì)算功能。

現(xiàn)在，ND H100 v5 預(yù)覽發(fā)布，將成為 Azure 產(chǎn)品組合中的標(biāo)準(zhǔn)服務(wù)。

標(biāo)簽：