您的位置:首頁(yè) > 資訊 >

微軟 Azure ND H100 v5 VM 虛擬機(jī)預(yù)覽發(fā)布:采用 8 至上千個(gè) NVIDIA H100 Tensor Core GPU

IT之家 4 月 14 日消息,據(jù)微軟 Azure 官方發(fā)布,微軟將過(guò)去十年的超級(jí)計(jì)算經(jīng)驗(yàn)和支持超大型 AI 訓(xùn)練工作負(fù)載的經(jīng)驗(yàn)應(yīng)用于搭建具備大規(guī)?;咝阅艿?AI 基礎(chǔ)架構(gòu)。微軟 Azure 智能云,特別是以圖形處理單元(GPU)加速的虛擬機(jī)(VM),為微軟及其客戶(hù)的生成式 AI 發(fā)展奠定了基礎(chǔ)。


【資料圖】

微軟現(xiàn)推出 ND H100 v5 VM,是 Azure 迄今更強(qiáng)大和高度可伸縮的 AI 虛擬機(jī)系列。該虛擬機(jī)支持的按需配置可達(dá) 8 至上千個(gè)通過(guò) Quantum-2 InfiniBand 網(wǎng)絡(luò)互連的 NVIDIA H100 GPU,使得 AI 模型的性能明顯提高。相較上一代 ND A100 v4 VM,本次推出的虛擬機(jī)包含以下創(chuàng)新技術(shù):

8 塊 NVIDIA H100 Tensor Core GPU,通過(guò)下一代 NV Switch 和 NV Link 4.0 互連。

在無(wú)阻塞胖樹(shù)網(wǎng)絡(luò)中,每個(gè) GPU 搭載 400 Gb / s NVIDIA Quantum-2 CX7 InfiniBand 和每 VM 3.2Tb / s 的性能。

每個(gè) VM 中的 8 塊本地 GPUs 之間通過(guò) 3.8Tb / s 對(duì)分割帶寬的 NV Switch 和 NV Link 4.0 互聯(lián)。

第四代英特爾至強(qiáng)可擴(kuò)展處理器。

PCIE 第 5 代主機(jī)到 GPU 互連,每個(gè) GPU 帶寬為 64Gb / s。

16 信道的 4800 MHz DDR5 內(nèi)存。

IT之家注:NVIDIA Quantum-2 采用第七代 NVIDIA InfiniBand 架構(gòu),可為 AI 開(kāi)發(fā)者和科學(xué)研究人員提供超強(qiáng)網(wǎng)絡(luò)性能和豐富功能,幫助他們解決充滿(mǎn)挑戰(zhàn)性的問(wèn)題。NVIDIA Quantum-2 通過(guò)軟件定義網(wǎng)絡(luò)、網(wǎng)絡(luò)計(jì)算、性能隔離、高級(jí)加速引擎、遠(yuǎn)程直接內(nèi)存訪問(wèn) (RDMA) 以及高達(dá) 400 Gb / s 的超快的速度,為先進(jìn)的超級(jí)計(jì)算數(shù)據(jù)中心提供助力。

微軟表示,大規(guī)模 AI 已內(nèi)置于 Azure 的 DNA 中。對(duì)大型語(yǔ)言模型研究(如圖靈)的初始投資,以及諸如在云中構(gòu)建第一臺(tái) AI 超級(jí)計(jì)算機(jī)等里程碑,都為生成式 AI 的問(wèn)世做好了充分準(zhǔn)備。Azure 機(jī)器學(xué)習(xí)等 Azure 服務(wù)使客戶(hù)能夠訪問(wèn) AI 超級(jí)計(jì)算機(jī),以進(jìn)行模型訓(xùn)練。Azure OpenAI 服務(wù)使客戶(hù)能夠利用大規(guī)模生成式 AI 模型的強(qiáng)大功能?!敢?guī)模」一直是 Azure 優(yōu)化 AI 基礎(chǔ)設(shè)施的目標(biāo)之一?,F(xiàn)在,微軟正為各種規(guī)模的初創(chuàng)公司和企業(yè)帶來(lái)無(wú)需大量物理硬件或軟件投入的超級(jí)計(jì)算功能。

現(xiàn)在,ND H100 v5 預(yù)覽發(fā)布,將成為 Azure 產(chǎn)品組合中的標(biāo)準(zhǔn)服務(wù)。

標(biāo)簽:

相關(guān)閱讀