“上云正成為芯片設計產業的一個趨勢。”燧原科技IT負責人Vincent近日在接受21世紀經濟報道采訪時表示。(北京芯片設計獵頭)
燧原科技是一家于2018年成立的AI芯片設計創業公司,是國內第一家完成人工智能訓練和推理芯片迭代的科技公司。近年來,內外環境的變化,讓燧原科技面臨諸多新挑戰。
一方面,是全球供應鏈的變化帶來產業轉移需求,導致芯片設計行業在市場繁榮的同時,催化了更大的競爭壓力;另一方面,是隨著產品迭代,工藝制程越來越先進,對算力需求也變得越來越大。
過去,芯片設計公司大都以部署本地算力為主,但是在新環境下,公司既要權衡投入產出比,又要加速產品研發進度搶占市場,因此,具有高彈性的云計算也成為芯片設計公司破局的首選。
然而,具體選擇什么樣的上云方案,行業內并沒有太多可借鑒的案例。而燧原科技與騰訊云、速石科技聯合打造的芯片仿真混合云平臺,在業內首次實現了“存算分離”的混合云計算架構,這或許會給更多芯片設計公司指明方向。
從彈性算力切入創業公司上云,要解決的核心問題有兩個:一是成本;二是業務彈性。
燧原科技項目負責人Eli告訴記者,從成本上來講,IC(集成電路)的設計有不同階段,每個階段對算力的需求又不一樣,所以企業沒有辦法采購相同配置的機器去適應所有業務環節。這種情況下,企業往往面臨重復建設,而且這個重復建設只是為了滿足很短的算力高峰。所以從使用效率和經濟成本上來講,上云肯定是最優解。
從業務彈性的角度,盡管芯片設計公司在項目前期都會進行充分的論證和討論,并給出算力、存儲等需求的大概預期,但在實際操作過程中,往往會出現很多意外情況。
“比如突然發現一個問題需要緊急修復,修復完以后就要進行大量業務測試,這時首先考慮的就不是經濟問題了,而是能以多快的速度得到相應的資源把突發的業務需求消化掉。”Eli說。
在傳統IDC的模式下,遇到這種突發情況企業很難快速應對,通常要通過采買服務器或是租借服務器的方式來部署,等上線測試完成已經過去兩周甚至幾周的時間。
而借助云計算的彈性,芯片設計公司在遇到意外增量時,便能夠迅速地將資源部署起來。“我們現在最快只需要幾個小時就能把所需資源全部部署完成,讓業務直接上去測試,整個產品迭代周期和迭代效率都得到大大提升。”Eli說道。
盡管從各項目性能以及綜合成本上來看,云計算都優于傳統IDC,但對絕大多數芯片設計公司而言,讓業務全部上云,仍不現實。這主要是因為出于數據安全、保密以及合規等因素,芯片設計公司需要把一些核心數據存儲在本地。
Vincent向記者表示,這也是為什么燧原科技在知道本地IDC資源有限的情況下,對上云依然是“大膽假設、小心求證”。而燧原科技最終選擇騰訊云和速石科技的解決方案,也是因為他們實現了“存算分離”的架構,能夠確保核心知識產權IP、PDK庫、gitlab代碼庫等數據存儲在本地,僅把算力放到云端。
現階段,云計算對燧原科技的核心作用是削峰,解決彈性算力的問題。據悉,燧原科技目前已經把前端IP驗證環節的彈性算力全部上云。數據顯示,通過上云,燧原科技的任務并發量可以通過云端彈性同步提升,縮短部分仿真任務周期30%~50%,節省IT投入相當可觀的綜合效益。
接下來,燧原科技還會把更多業務環節的彈性算力上云。Eli表示,“我們這次只選擇一個點,是要把整個項目的風險控制在一個合理范圍內。這次把一個業務搬上云三方團隊花了五六個月時間去驗證,保障核心數據、代碼存儲在本地的前提下,并通過速石平臺與本地計算集群打通,使得計算任務能夠靈活選取本地或云端算力隊列。芯片設計上云需要逐步磨合,慢慢擴大使用規模。”
高性能計算落地從騰訊云的視角,可以看到云計算是如何一步步接近芯片設計產業的。
騰訊云高性能計算行業高級經理Kevin向21世紀經濟報道表示,從2021年起,騰訊云內部就開始探索高性能計算場景,當時也梳理了一些機會點,比如芯片設計、基因測序、科研計算等等。經過一番摸索,騰訊云發現芯片設計的仿真環節對高性能計算存在剛性需求,并且這塊業務的市場規模也很大,于是開始聚焦于此。
芯片設計周期一般超過12個月,包括產品定義、前端設計、IP驗證、SOC驗證、綜合、布局布線等多個階段,且不同階段對算力的需求也不相同。
“在整個芯片的誕生過程中,仿真和驗證環節,對彈性算力的需求比較大,其他環節則相對平穩。”Kevin表示。明確方向后,騰訊云開始與芯片設計行業接觸,這個過程中,騰訊云的合作伙伴速石科技則扮演了非常重要的角色。(北京芯片設計獵頭網)
速石科技成立于2017年,主要業務是為用戶提供一站式研發云平臺。速石科技大客戶經理鄧雄偉告訴記者,在燧原項目中,騰訊云主要是提供IaaS層服務,包括基礎資源和基礎硬件的運維,而速石是基于IaaS資源做PaaS層平臺的搭建,比如這次的芯片設計仿真云平臺。
實際上,此次采用的存算分離混合云解決方案并不是一個新概念,此前也早已在多個領域應用。但這次燧原科技項目,卻是該方案第一次應用于芯片設計產業。所以在項目實施過程中,也遇到一些挑戰。
“比如燧原科技在整個混合云建設架構的要求上非常高,對網絡時延、寬帶的吞吐率和效率的要求也非常高,因此整個項目的實施過程,需要多方一起尋求架構最優的布置方式。”速石科技技術總監陳琳濤表示。
從結果來看,騰訊云、速石科技和燧原科技聯合打造的“存算分離”云平臺,是一種更精細化的混合云場景,這對于一些先進制程的芯片設計公司而言,具有很強的適用性。
陳琳濤說,這種存算分離的方案減少了半導體企業的數據流轉步驟,也統一了數據安全訪問策略,并簡化了上云場景選擇和數據準備過程,對整個行業的發展都起到積極推動作用。據Kevin透露,在燧原項目落地后,該方案已經在其他芯片行業客戶上開始復制。
當然,對芯片行業而言,云計算的想象空間還很大。但實現更多落地應用的前提是,云計算不僅要保證效率足夠高,更要獲得芯片設計公司足夠的信任。Kevin告訴記者,目前騰訊云已經在對可信計算做相應的鋪墊和研究,2023年便能提供相應能力。屆時,如果能對整個計算環境都有加密的過程,那或許能夠打消很多客戶對數據上云的顧慮。
來源:21世紀經濟報道