2023 年即將成為基于 Arm 的服務器芯片的重要一年,這一驅動力的很大一部分將來自 Nvidia,它似乎堅定地相信 Arm 的未來,即使它不能擁有這家公司。
預計有幾家系統供應商將在明年推出將使用 Nvidia 新的基于 Arm 的芯片的服務器。其中包括Grace Superchip,它結合了 Nvidia 的兩個 Grace CPU,以及 Grace-Hopper Superchip,它將一個 Grace CPU 和一個 Hopper GPU 結合在一起。(半導體人才招聘網)
排隊服務器的供應商包括戴爾科技、HPE和美超微等美國公司,以及中國的聯想、中國的浪潮,以及臺灣的華碩、富士康、技嘉和緯穎科技。這些服務器將針對高性能至關重要的應用領域:人工智能訓練和推理、高性能計算、數字孿生以及云游戲和圖形。
盡管 Nvidia 已保證未來將繼續使用英特爾和 AMD 的 x86 CPU,但這家芯片公司一方面希望通過承諾在目前市場上的 x86 芯片上取得一些重大進步,另一方面,他們也想將數據中心運營商和開發人員吸引到 Arm 方面。
這些進步包括 144 個內核、高達 1TB 的糾錯 LPDDR5x 內存以及用于 Grace Superchip 的單個插槽中高達 1TB/s 的內存帶寬。為了讓 Superchip 的兩個 CPU 進行通信,Nvidia 正在使用其 900GB/s NCLink-C2C 互連技術,該技術也被用于連接 Grace Hopper Superchip 內部的 CPU 和 GPU。
Nvidia 數據中心計算總監 Paresh Kharya 告訴The Register:“Grace 允許我們突破創新的界限并解決市場上的差距。”
他聲稱 900GB/s 的互連速度比 PCIe Gen 5 技術快 7 倍,該技術將與即將推出的英特爾Sapphire Rapids 服務器芯片和Genoa服務器芯片的一起亮相?!皼]有其他東西可以與其速度相匹配,”他說。
Kharya 提出了其他一些關于來自 Nvidia 的基于 Arm 的superchips的主要聲明,包括由于使用 LPDDR5x,內存子系統的能效提高了 2 倍,與目前市場上可用的系統相比,內存帶寬提高了 2 倍。
Nvidia 還談到了帶有 Grace Superchip 的系統在處理 CPU 密集型任務時的表現:當然,根據他們自己的基準,在 SPECrate 2017_int_base 基準測試中估計得分為 740。如果我們按照他們的數字計算,這將使系統比 Nvidia 的 DGX A100 系統的 CPU 能力快 50%,該系統使用 2019 年推出的兩個 64 核 AMD Epyc 7742 處理器。
Kharya 表示,Nvidia 將 Grace Superchip 與三年前的 x86 處理器進行了比較,因為它認為 DGX A100 是當今可用于 AI 應用的“頂級服務器”。
“因此,我們真的很喜歡 x86 CPU 帶來的所有創新,我們和我們的客戶能夠利用所有這些,但與此同時,我們的產品組合中現在有了 Grace,我們能夠推動創新的邊界,填補空白,”他說。
但要利用這些功能,數據中心運營商和開發人員將需要從舒適的 x86 系統世界邁向有趣的 Arm 服務器世界。
這似乎是一個巨大的飛躍,但 Kharya 表示,英偉達已經與 Arm 合作,為服務器軟件生態系統做準備,做了很多基礎工作。這始于 2019 年,當時這家GPU 巨頭宣布將對 CUDA 編程模型及其“全棧 AI 和 HPC 軟件”的支持擴展到基于 Arm 的服務器 CPU。從那時起,英偉達就讓更多的軟件兼容。
“我們在 2019 年不久前宣布了我們的 CUDA on Arm 項目,我們一直在朝著這個目標不斷前進。我們所有的關鍵堆棧都支持 Arm,其中包括我們的 AI 平臺、Nvidia AI、我們的 Omniverse 數字孿生平臺以及我們的 Nvidia HPC 平臺。因此,我們正在與整個生態系統合作以確保準備就緒,”Kharya 說。
該公司還確?;?Arm 的服務器將通過其 Nvidia 認證系統計劃提供最佳性能,該計劃已經包括現在市場上使用Ampere Computing 的基于 Arm 的 Altra 芯片的GPU 服務器。
一些組織已經宣布計劃使用帶有 Nvidia 的 Grace 和 Grace Hopper 超級芯片的服務器,包括美國能源部的洛斯阿拉莫斯國家實驗室,該實驗室將在其下一代 Venado 超級計算機中使用這兩種芯片。(芯片行業招聘)
但真正的考驗將在未來幾年內上演,因為 Nvidia 試圖讓數據中心世界相信 Arm 的差異化,并且組織開始將公司的服務器設計納入他們的步伐。
來源:半導體行業觀察