供應(yīng)鏈數(shù)據(jù)顯示,2024年AI服務(wù)器出貨量同比激增46%,但2025年增長曲線將受三大關(guān)鍵因素擾動:??英偉達(dá)GB系列機架交付進(jìn)度??、地緣政治風(fēng)險,以及由開源模型DeepSeek引發(fā)的行業(yè)連鎖反應(yīng)。目前主流機構(gòu)給出28%基礎(chǔ)增長預(yù)期,但實際增幅可能在20%-35%區(qū)間劇烈波動。
微軟、Meta等超大規(guī)模云服務(wù)商已明確將2025年AI基礎(chǔ)設(shè)施預(yù)算上調(diào)30%,這為base case情境提供支撐。不過行業(yè)觀察發(fā)現(xiàn),GB200/GB300機架因??系統(tǒng)驗證周期延長??,可能迫使亞馬遜等客戶轉(zhuǎn)向HGX架構(gòu)過渡。更值得關(guān)注的是,DeepSeek等開源模型的崛起正改變技術(shù)路線選擇——據(jù)供應(yīng)鏈消息,至少三家頭部CSP已秘密啟動基于自研ASIC的推理服務(wù)器項目。
在worse case模型中,GB機架出貨延遲與??ASIC替代加速??可能形成雙重壓制。某ODM廠商透露:"GB300需要的液冷解決方案測試周期比預(yù)期長6-8周,而客戶對B100采購訂單的附加條款明顯增加了技術(shù)驗證要求。"與此同時,采用DeepSeek模型的邊緣計算廠商正嘗試用4顆MI300X替代傳統(tǒng)8卡配置,這種"減半效應(yīng)"可能重塑2025年GPU需求結(jié)構(gòu)。
bullish case情境則暗藏產(chǎn)業(yè)變數(shù):美國Stargate計劃刺激的政府訂單可能意外填補消費級AI需求缺口。值得注意的是,??推理工作負(fù)載占比??已從2023年的38%攀升至當(dāng)前44%,TrendForce預(yù)測該數(shù)值2025年Q4或?qū)⒂|及49%。某半導(dǎo)體設(shè)備商高管指出:"我們接到的ASIC光刻機訂單中,推理芯片制程要求普遍比訓(xùn)練芯片低1-2個技術(shù)節(jié)點,這顯著降低了CSP的試錯成本。"
行業(yè)共識認(rèn)為,2025年將成為AI基礎(chǔ)設(shè)施的??架構(gòu)分水嶺??:云端訓(xùn)練集群繼續(xù)依賴英偉達(dá)全棧方案,但推理市場將呈現(xiàn)ASIC、GPU、FPGA多元并存的局面。最新流片數(shù)據(jù)顯示,頭部CSP自研推理芯片的晶體管密度已達(dá)同期H100的83%,而成本僅為其62%——這種性價比優(yōu)勢正在改寫傳統(tǒng)GPU的統(tǒng)治地位。