5月17日,由工業(yè)和信息化部、安徽省人民政府主辦的2023世界電信和信息社會日大會在安徽合肥成功舉辦。在大會同期召開的“智能算網(wǎng)與數(shù)字經(jīng)濟發(fā)展”論壇上, 新華三集團運營商事業(yè)部技術總監(jiān)陳峰受邀出席并發(fā)表主題演講。

智能算力的“優(yōu)”與“憂”
《2022—2023 中國人工智能計算力發(fā)展評估報告》顯示,中國人工智能計算力繼續(xù)保持快速增長,2022年智能算力規(guī)模達到268EFLOPS,超過通用算力規(guī)模,預計到2026年中國智能算力規(guī)模將達到1271.4EFLOPS。眾所周知,智能算力對于提升國家、區(qū)域經(jīng)濟核心競爭力的重要作用已經(jīng)成為業(yè)界共識。隨著“東數(shù)西算”工程的啟動以及智算中心的建設,從國家層面實現(xiàn)有效的資源結構整合,助力產(chǎn)業(yè)結構調整,構建更為健全的算力、算法基礎設施。
“當前,智能算力規(guī)模已超過通用算力,并將持續(xù)高速增長?!? 陳峰在演講中表示。據(jù)悉,目前我國數(shù)據(jù)中心通用算力占比90%以上,未來五年智能算力復合增長率達52.3%,同期通用算力規(guī)模的復合增長率為18.5%,人工智能計算需求未來將占據(jù)80%以上的計算需求。
隨著近期GhatGPT的爆火,AIGC引發(fā)了智能算力的巨大需求?!凹僭OChatGPT有1750億參數(shù),訓練一次模型的總算力消耗約為3640P,需要7~8個投資規(guī)模30億、算力500P的數(shù)據(jù)中心才能支撐運行,且消耗GPU算力?!标惙逵肅hatGPT舉例道。“雖然全國智算中心建設項目已超過40多個,但能提供的智能算力不足20 EFLOPS,智能算力供需缺口較大。”可以確定,AIGC爆發(fā)進一步推動了智能算力的需求,對于智算中心來說,既是巨大需求和商機,又是極大挑戰(zhàn)。
新華三持續(xù)提供高效、共享智能算力服務
相關數(shù)據(jù)顯示,中國AI服務器市場領跑全球,2021年人工智能服務器市場規(guī)模59.2億美元,與2020年相比增長68.2%,預計到2026年,中國人工智能服務器市場將達到123.4億美元。
“高性能AI服務器可提供超強智能算力?!闭劶癆I服務器陳峰特別強調。對于小型訓練和推理場景中,可使用PCIE形態(tài)的節(jié)點,同樣應該支持異構混合算力;而在大模型訓練集群則需要高性能網(wǎng)絡的有力支撐,往往采用混合并行的方式進行訓練,GPU集群從存儲集群拉去樣本數(shù)據(jù)、GPU節(jié)點之間的參數(shù)交互,這兩個數(shù)據(jù)傳輸?shù)牧鞒潭夹枰咝阅堋⒌脱訒r的網(wǎng)絡作為基礎。
新華三的算力網(wǎng)絡是基于兩個基礎建立起來的,一是源于整個數(shù)據(jù)中心網(wǎng)絡的網(wǎng)絡控制器,WAN的控制器,能夠全面了解現(xiàn)網(wǎng)的所有的,尤其是承載網(wǎng)的所有信息,并進行相應的控制;另一個就是多地的智算平臺,包括上面匯聚的多云管理平臺形成的對算力資源整體的了解和供應能力,以及納管?!霸谶@兩個之上,我們構建算網(wǎng)大腦,完成算和網(wǎng)的一體化信息拉通和資源的供給能力,我們對北向也提供非常開放的,豐富的接口,提供給算網(wǎng)運營,算網(wǎng)編排,也可以提供給各種paas應用,來更好地進行應用的銜接和結合”陳峰表示。
“新華三智算中心運營平臺可提供高效、共享智能算力服務能力支持?!标惙褰榻B道。通過統(tǒng)一運維運營中心,每一項服務需求都按交付單的方式整體執(zhí)行,各模塊分工明確,既可實現(xiàn)產(chǎn)品自由組合,同時保證流程順暢傳遞,保證了智算中心的順利運行。
“標準、融合、安全、試點?!边@是陳峰為智算發(fā)展提出的四個建議關鍵詞。智算中心是算力網(wǎng)絡的重要組成,但是目前在智算中心RoCE網(wǎng)絡、智算中心與算網(wǎng)的融合、智算中心安全要求等方面在標準、互通性、標準成熟性還存在明顯的差距,新華三期望產(chǎn)業(yè)界可以盡快推動相關的標準成熟,并通過試點方式推動技術的驗證。未來,新華三也將持續(xù)在算網(wǎng)融合領域深耕,攜手運營商及產(chǎn)業(yè)相關單位,共同為智能算網(wǎng)與數(shù)字經(jīng)濟發(fā)展助力。