過去幾年,AMD 和 Arm 在服務器 CPU 市場上一直在追趕英特爾,隨著數據中心運營商和服務器品牌開始從數量上尋找解決方案,AMD 贏得的份額利潤在 2022 年尤其大。根據主要關注服務器行業的 DIGITIMES Research 分析師 Frank Kung 的說法,第二大制造商的增長優于長期領先者,他預計 AMD 的份額將在 2023 年超過 20%,而 Arm將獲得 8%的份額。(寧波芯片設計獵頭)
價格是導致數據中心運營商和服務器品牌轉向 AMD 的三大驅動因素之一。比較核心數、時鐘速度和硬件規格相似的AMD和英特爾的服務器CPU,前者的大部分產品價格標簽比后者至少便宜30%,差異甚至高達40%以上,Kung說。
這種差距對服務器公司產生了關鍵影響,因為他們通常會大量采購 CPU,而選擇 AMD 的解決方案將大大降低成本。Kung 指出,由于英特爾和 AMD 的處理器都是基于 x86 架構,因此兼容性不是服務器公司需要擔心的問題。
AMD CPU 的高內核數也使其非常適合服務器環境,因為 CPU 的內核數越多,它可以提供的服務能力就越強。AMD 的 96 核 Genoa 架構 EPYC 處理器于 2022 年第四季度推出,128 核 CPU 將于 2023 年上半年首次亮相,而英特爾目前在核心數方面的最佳產品仍停留在 60 個。
臺積電的支持是第二個驅動因素。AMD的服務器CPU全部采用臺積電最新制程制造,性能表現一流,得益于臺積電的先進技術和高良率,AMD沒有出現錯過產品上市時間的問題。然而,英特爾并非如此。
第三個驅動因素是英特爾正在內部制造其所有頂級 CPU。來自英特爾上游供應商的信息顯示,過去幾年英特爾自產技術不穩定,服務器品牌商和數據中心運營商經??吹接⑻貭柾七t其新服務器平臺的量產計劃。
在數據中心運營商中,微軟和谷歌最熱衷于采購采用 AMD 解決方案的服務器。目前,兩家云服務提供商超過 30% 的服務器訂單都是基于 AMD 的型號,而在服務器品牌中,惠普企業 (HPE) 更熱衷于采用 AMD 技術的服務器。
Kung 表示,就市場份額增長而言,2022 年基于 Arm 的處理器在服務器市場的滲透率比基于 AMD 的處理器要慢一些,到 2023 年增長將進一步放緩。然而,從長遠來看,基于 Arm 的處理器仍將具有大幅增長的潛力。
盡管基于 Arm 的 CPU 與 AMD 和 Intel 的基于 x86 的 CPU 相比可以實現并駕齊驅的計算性能,同時功耗要低得多,但兼容性是目前它們最大的弱點。
由于大多數服務器程序都是基于 x86 架構設計的,因此問題不太可能得到解決,直到更多基于 Arm 的服務器開始出現,吸引更多中間件開發人員加入市場并編寫解決方案來為 Arm 系統翻譯 x86 代碼。
然而,數據中心運營商和服務器品牌仍然對 Arm 處理器在服務器市場的發展持積極態度。亞馬遜和阿里巴巴已經在 2022 年之前開始開發基于 Arm 的產品,微軟和谷歌也在 2022 年開始使用 Arm 產品的項目,HPE 正在擴大其對基于 Arm 的服務器的采用。英偉達現在正在推動其 GPU 支持 Arm 架構,而 Ampere 正在開發基于 Arm 的芯片。Kung 補充說,在未來幾年,隨著大型數據中心和邊緣計算服務器的需求激增,預計 ESG 將為 Arm CPU 帶來機遇。
蘇姿豐:下一個挑戰是能效
“在接下來的十年里,我們必須將能源效率視為最重要的挑戰,”AMD 首席執行官Lisa Su(蘇姿豐)在舊金山舉行的2023 年 IEEE 國際固態電路會議(ISSCC) 上對工程師們說。
盡管摩爾定律放緩,但其他因素推動主流計算能力大約每兩年半翻一番。對于超級計算機,翻倍的速度更快。然而,Su 指出,計算的能源效率并沒有跟上步伐,并指出未來十年后的超級計算機需要多達 500 兆瓦的電力。
“這與核電站差不多。” Su說,沒有人真正知道如何實現下一次超級計算機能力的千倍增長,但它肯定需要提高系統級效率,這不僅意味著芯片上的節能計算,還意味著高效的芯片間通信和低功耗內存訪問。
在計算方面,Su 指出了處理器架構、先進封裝的改進,以及更好的硅技術。這種組合可以使行業歷史性的每瓦性能增長率提高一倍以上。例如,Su 將MI250X加速器 GPU與其前身 MI100 進行了比較,該 GPU 落后于五臺最高效的超級計算機中的四臺。較新的芯片提供 4.2 倍的性能和 2.2 倍的效率。其中,chiplet 設計和集成貢獻了近一半的性能提升和約 30% 的效率提升。
“我們最近擁有的最大杠桿可能是使用先進的封裝和小芯片,”她說。“它使我們能夠比以往任何時候都更緊密地將計算組件結合在一起?!睋?AMD 稱,基于小芯片的系統中的 3D 互連可以傳輸大約 50 倍的比特/焦耳能量,就像主板上的銅連接一樣。使用稱為 3D V-cache 的技術,AMD 計算小芯片現在可以在其上堆疊額外的 SRAM 以擴展其緩存的大小。
Su 指出的另一個節能因素是所謂的領域特定計算,Su 將其描述為“為正確的操作使用正確的數學”。由于 8 位浮點運算的能效約為 64 位浮點運算的 30 倍,因此 GPU 和其他 AI 加速器芯片的制造商一直在尋找盡可能使用此類低精度運算的方法。特定領域的架構約占 MI250X 性能和效率改進的 40%。
AMD 希望從其下一代 MI300 中再獲得 8 倍的性能提升和 5 倍的效率提升。(寧波芯片設計獵頭網)
但Su說,處理器創新本身不足以實現 Zettascale 超級計算。由于 AI 性能和效率的提高超過了主導超級計算機物理工作的那種高精度數學的收益,因此該領域應該轉向可以利用 AI 效率的混合算法。例如,人工智能算法可以快速高效地逼近一個解,然后通過高精度計算來填補人工智能答案與真實解之間的差距。