亚洲欧美在线成人,久久99久久久,午夜婷婷网

聯(lián)想近日宣布推出旗下首款基于AMD技術的AI服務器——聯(lián)想問天WA7785a G3。該服務器在單機部署671B（滿血版）DeepSeek大模型時，?實測最高吞吐量達到6708 token/s，刷新了大模型推理性能的行業(yè)標準。

這一突破得益于聯(lián)想萬全異構智算平臺的創(chuàng)新設計。通過訪存優(yōu)化、顯存優(yōu)化、PCIe 5.0全互聯(lián)架構以及SGLang框架中性能最優(yōu)算子的精選，聯(lián)想對DeepSeek大模型從預訓練、后訓練到推理的全流程進行了深度優(yōu)化。

在模擬問題對話場景（上下文序列長度128/1K）中，聯(lián)想問天WA7785a G3最高支持并發(fā)數(shù)158，TPOT（每次輸出時間）為93毫秒，TTFT（首次輸出時間）為2.01秒。而在模擬代碼生成場景（上下文序列長度512/4K）中，并發(fā)數(shù)可達140，TPOT為100毫秒，TTFT為5.53秒。

這一性能表現(xiàn)意味著單臺聯(lián)想問天WA7785a G3可支撐1500人規(guī)模企業(yè)的日常需求，相比此前聯(lián)想問天WA7780 G3服務器單機部署DeepSeek大模型時2500 token/s的吞吐量，實現(xiàn)了顯著提升。

聯(lián)想表示，此次突破是聯(lián)想中國基礎設施業(yè)務群、聯(lián)想研究院ICI實驗室與AMD聯(lián)合設計、協(xié)同調(diào)優(yōu)的成果。目前，雙方仍在探索深度調(diào)優(yōu)的新方法，以進一步提升性能。

此外，聯(lián)想問天WA7785a G3的推出也標志著聯(lián)想在AI服務器領域的技術積累進一步深化。隨著大模型應用場景的不斷擴展，高性能、低延遲的AI服務器將成為企業(yè)數(shù)字化轉型的關鍵基礎設施。

免責聲明：本網(wǎng)站轉載其他網(wǎng)站內(nèi)容，出于傳遞更多信息而非盈利之目的，同時并不代表贊成其觀點或證實其描述，內(nèi)容僅供參考。版權歸原作者所有，若有侵權，請聯(lián)系我們刪除。

久久久久久久久久久久久久久久久久久久_中文字幕色网_国产成人不卡_男人插女人网站_手机成人在线_人人爽人人做_日韩女优在线观看_国产中文欧美日韩在线_直接看av的网站_国产又粗又猛又色

聯(lián)想推出首款AMD AI服務器，單機部署DeepSeek大模型實現(xiàn)6708 token/s吞吐量

熱門資訊

計劃高級主管是什么工作

模擬版圖設計工程師有出路嗎

中國“人造太陽”預計2027年竣工有望成人類首個聚變發(fā)電裝置國際合作同步推進

徹底攤牌了！臺積電芯片再漲價20%，央視：對“炒芯”絕不手軟

傳媒行業(yè)AI崗位需求激增，但技術缺陷催生新職業(yè)機會

高級制程工藝整合研發(fā)工程師招聘