在线日韩女同,久久久久久久久久爽,欧美日高啪在线精视频,国产av美女被我操,玖玖视频在线观看免费,日韩乱人伦Av,九色高潮视频在线播放,青青re在线视频,大鸡巴在线视频网

邊緣計(jì)算行業(yè)專題報(bào)告:始于AI,賦能應(yīng)用
作者 | 未來智庫2023-05-22

1. 投資要件

當(dāng)前市場普遍聚焦于云端算力發(fā)展,忽視了邊緣算力在 AI 乃至社會數(shù)字化發(fā)展中的重要 地位。隨著 AI 大模型應(yīng)用逐漸滲透進(jìn)入千行百業(yè)和各類垂直細(xì)分場景,單純的大規(guī)模計(jì) 算中心提供的算力將不能滿足多樣化的 AI 運(yùn)算需求?;趲c(diǎn)判斷,我們認(rèn)為邊緣算力 具備不可或缺性: 第一,未來隨著計(jì)算芯片加速發(fā)展,單位算力成本中,電費(fèi)與土地費(fèi)用占比將愈發(fā)提升, 算力成本將取決于智算中心的地理位置,以我國舉例,未來算力成本較低的西部將是云 端算力主要部署地。因此,大算力與低時延需求將出現(xiàn)錯配。 第二,AI 模型推理 Token 費(fèi)用較貴,如果需要成熟商用,邊緣預(yù)處理將是必須選項(xiàng)。通 過邊緣部署的算力,將用戶的多樣化需求進(jìn)行本地的預(yù)處理,簡單的需求直接利用本地 模型和算力推理,復(fù)雜需求通過邊緣算力預(yù)處理后,精簡成最少的 TOKEN 發(fā)送至云端, 從而能夠最低成本的實(shí)現(xiàn)應(yīng)用功能,加速商業(yè)化。同時,面向小算力時,ARM 架構(gòu)由于 其架構(gòu)簡單,比英偉達(dá)復(fù)雜架構(gòu)計(jì)算卡更具成本優(yōu)勢,也將加速邊緣小算力的滲透速度。

最后,無論是對用戶個人敏感數(shù)據(jù)進(jìn)行推理,還是推理設(shè)計(jì)商業(yè)敏感數(shù)據(jù),完全與云端 隔絕的邊緣算力,能為用戶提供最好的數(shù)據(jù)安全保護(hù)。因此,從時延、成本、隱私三大 方面來看,邊緣算力未來算力體系的重要構(gòu)成部分,也是 AI 需求連接萬物的毛細(xì)血管。 當(dāng)前市場普遍聚焦于邊緣場景中的大單品邏輯,忽視了邊緣生態(tài)的多樣性。當(dāng)前市場聚 焦于智能音響,智能耳機(jī)等大單品及其部件,主要是其作為 AI 入口的邏輯更具備直接 性。但我們認(rèn)為,隨著 AI 加速向邊緣滲透,應(yīng)用的形式將愈發(fā)多樣,越來越多的中小廠 商將參與到不同場景,不同細(xì)分領(lǐng)域的 AI 智能硬件開發(fā)中來。隨著應(yīng)用形式愈發(fā)多樣, 如何在海量不同設(shè)備上部署標(biāo)準(zhǔn)化的 AI 邊緣算力將成為一個重要問題。我們判斷,物聯(lián) 網(wǎng)模組將成為承載這類算力的重要形式。物聯(lián)網(wǎng)模組集成了通信芯片與全球大廠的算力 芯片,能為海量場景和中小廠商提供穩(wěn)定的邊緣通信能力和邊緣算力,大大降低了中小 開發(fā)者部署邊緣算力的門檻和難度。AI 時代,是萬眾創(chuàng)新的年代,海量的開發(fā)將來自中 小開發(fā)者,而模組提供的算力,將成為邊緣算力中的重要部分。

2. 模型由大到小,AI 走上應(yīng)用的快速路

今年年初,隨著 Chatgpt 的發(fā)布,以 LLM 模型為主導(dǎo)的生成式大模型高速發(fā)展。在 Chatgpt 之前,AI 發(fā)展通常以面向細(xì)分行業(yè)的小模型為主,追求較小運(yùn)行成本下的較快商業(yè)化。 Chatgpt 問世之后,證明了“野蠻”堆砌參數(shù)與算力的生成式模型之路是可以走通的,因 此,短期內(nèi)全球 AI 模型開發(fā)的風(fēng)向轉(zhuǎn)向了堆砌參數(shù)與算力的模式。 隨著 GPT-4 的發(fā)布,標(biāo)志大語言模型正式邁入了多模態(tài)時代,參數(shù)量近一步膨脹。4 月 份,OPENAI 創(chuàng)始人 SAM Altman 在一場 MIT 舉辦的活動上表示,“未來的 AI 進(jìn)展不會 來自于讓模型變得更大”,我們認(rèn)為,這代表著 OPENAI 之后的努力將會更多的轉(zhuǎn)向如何 讓現(xiàn)有的大模型更好用,滲透進(jìn)更多的場景。

從北美的趨勢來看,當(dāng)下,在大模型基礎(chǔ)上,快速建立小模型生態(tài),正是許多大模型龍 頭正在高速推進(jìn)的發(fā)展方向。如何推動模型實(shí)現(xiàn)“人人可訓(xùn),人人可用”已經(jīng)成了海外 大廠爭相布局的方向。 4 月 12 日,微軟正式開源 DeepSpeedchat 訓(xùn)練模型,這個訓(xùn)練方式擁有三大核心優(yōu)勢, 第一,簡化 ChatGPT 類型模型的訓(xùn)練和強(qiáng)化推理體驗(yàn),第二,DeepSpeed-RLHF 模塊, 第三,DeepSpeed-RLHF 系統(tǒng)。 基于這三大特性,DeepSpeed-HE 比現(xiàn)有系統(tǒng)快 15 倍以上,使 RLHF 訓(xùn)練快速且經(jīng)濟(jì)實(shí) 惠。例如,DeepSpeed-HE 在 Azure 云上只需 9 小時即可訓(xùn)練一個 OPT-13B 模型,只需 18 小時即可訓(xùn)練一個 OPT-30B 模型。這兩種訓(xùn)練分別花費(fèi)不到 300 美元和 600 美元。 此外,該系統(tǒng)可以支持超千億參數(shù)的模型訓(xùn)練,并且增強(qiáng)了對于單張顯卡的訓(xùn)練支持, 僅憑單個 GPU,DeepSpeed-HE 就能支持訓(xùn)練超過 130 億參數(shù)的模型。

如果說 DeepSpeedchat 是模型界邁向應(yīng)用與生態(tài)建設(shè)的第一步,那么在五月初的幾大 變化,讓我們更加堅(jiān)信了,萬物搭載模型,模型賦能萬物的時代正在加速到來。 首先,便是知名華人 AI 研究者陳天奇牽頭開發(fā)的 MLC-LLM 解決方案,MLC LLM 為用戶 在各類硬件上原生部署任意大型語言模型提供了解決方案,可將大模型應(yīng)用于移動端(例 如 iPhone)、消費(fèi)級電腦端(例如 Mac)和 Web 瀏覽器。 MLC 的主要功能包括了: (1)支持不同型號的 CPU、GPU 以及其他可能的協(xié)處理器和加速器。 (2)部署在用戶設(shè)備的本地環(huán)境中,這些環(huán)境可能沒有 python 或其他可用的必要依賴 項(xiàng);通過仔細(xì)規(guī)劃分配和積極壓縮模型參數(shù)來解決內(nèi)存限制。 (3)MLC LLM 提供可重復(fù)、系統(tǒng)化和可定制的工作流,使開發(fā)人員和 AI 系統(tǒng)研究人員 能夠以 Python 優(yōu)先的方法實(shí)現(xiàn)模型并進(jìn)行優(yōu)化。MLC LLM 可以讓研究人員們快速試驗(yàn) 新模型、新想法和新的編譯器 pass,并進(jìn)行本地部署。

其次,我們看到了隨著 Meta 開源 LLaMA,整個北美 AI 開發(fā)者中,正在快速興起基于 LLaMA 的訓(xùn)練風(fēng)潮,同時隨著 Lora 等訓(xùn)練方法的加速滲透,我們判斷,中小開發(fā)者蒸 餾,訓(xùn)練,部署自由模型的成本正在快速降低,整個開源生態(tài)下,模型梯度分布的格局 正在加速建立。 Lora 訓(xùn)練法通過凍結(jié)預(yù)訓(xùn)練的模型權(quán)重,并將可訓(xùn)練的秩分解成矩陣注入到 Transformaer 架構(gòu)的每一層,極大的減少了下游任務(wù)的可訓(xùn)練參數(shù)的數(shù)量,有效提升了 預(yù)訓(xùn)練模型在下游任務(wù)的 finetune 效率。

上述的三種模型或解決方案,DeepspeedChat,MLC-LLM,Lora 模型,其中 Deepspeed 與 Lora 模型給中小開發(fā)者提供了低成本,快速訓(xùn)練專屬于自己的小模型的完整工具,而 MLC-LLM 則為中小開發(fā)者在算力較低的環(huán)境或者邊緣進(jìn)行模型的推理搭建了基礎(chǔ),三大 工具,我們認(rèn)為已經(jīng)形成了 AI 走向邊緣的“基建雛形”。 上文闡述了來自開源社區(qū)或者中小開發(fā)者參與的模型應(yīng)用變化,在 Chatgpt 面世以來, 大廠也在加速邊緣推理能力,小模型的開發(fā)。

2 月,全球手機(jī)與 IOT 芯片龍頭高通,展示了其在搭載 8Gen2 的手機(jī)平臺生利用 StableDiffusion 生成了圖片,耗時小于 15 秒。在 5 月,高通通過持續(xù)優(yōu)化,將生成圖片 的時間縮短至 12 秒。

高通通過與其芯片配套的全棧AI優(yōu)化方案,將 stable diffusion 模型從 FP32 壓縮至 INT8, 顯著的降低了運(yùn)行時延和能耗,從而實(shí)現(xiàn)了模型在手機(jī)算力上的安全高效推理。高通發(fā) 布的全棧 AI 工具,包括了 INT8 轉(zhuǎn)化,最小化內(nèi)存溢出,適配 Hexagon 處理器的 AI 加 速等功能,能夠讓 OEM 廠商快速在高通的算力環(huán)境中部署其 AI 應(yīng)用。

在 5 月,谷歌也發(fā)布了其全新的語言大模型 PaLM2,并作為發(fā)布會中大部分 AI 功能的 基礎(chǔ)模型,值得注意的是,PaLM2 是一個擁有眾多版本和參數(shù)量的模型體系,其包含了 4 個不同參數(shù)的模型,包括壁虎(Gecko)、水獺(Otter)、野牛(Bison)和獨(dú)角獸(Unicorn), 并在特定領(lǐng)域的數(shù)據(jù)上進(jìn)行了微調(diào),為企業(yè)客戶執(zhí)行某些任務(wù)。其中 PaLM 2 的最輕版 本 Gecko 足夠小,可以在手機(jī)上運(yùn)行,每秒處理 20 個 tokens,大約相當(dāng)于 16 或 17 個 英文單詞,谷歌在模型梯度分布上的重視程度,也進(jìn)一步驗(yàn)證了小模型作為 AI 滲透進(jìn)入 萬千場景的必要性。

將視角拉回國內(nèi),國內(nèi)廠商在邊緣小模型上也正在加速布局,5 月,中科創(chuàng)達(dá)發(fā)布 Rubik 魔方大模型,根據(jù)公司官網(wǎng)介紹,中科創(chuàng)達(dá)基于在機(jī)器人領(lǐng)域的深厚積累,中科創(chuàng)達(dá)將 智能音箱與機(jī)器人進(jìn)行融合,并通過中科創(chuàng)達(dá)魔方 Rubik 大模型的不斷訓(xùn)練,已經(jīng)實(shí)現(xiàn) 了能夠自由對話的智能銷售機(jī)器人,可以自主回答客戶關(guān)于企業(yè)及產(chǎn)品的各種問題,為 企業(yè)營銷及客戶拓展提供了新的助力。

可以看出,除了開源社區(qū)和前沿學(xué)者正在不斷加速模型的可用性,以及邊緣推理的探索, 越來越多的大廠也加入到了布局邊緣模型的新一輪“軍備競賽”中來,我們認(rèn)為,隨著 兩方的共同努力,一個由“基礎(chǔ)模型”,“低成本定制工具”,“模型優(yōu)化工具”三者共同 構(gòu)建的邊緣模型生產(chǎn)與利用體系將會飛速發(fā)展。

3. 梯度分布,算力的終極呈現(xiàn)形式

當(dāng)前市場主要聚焦于云端算力,但往往忽略了云端之外的算力同樣重要,未來隨著摩爾 制成達(dá)到極限,數(shù)據(jù)傳輸成本,時延,隱私等等因素的影響,我們早在 2022 年發(fā)布的報(bào) 告《算力革命:泛在、綠色與生態(tài)》中就強(qiáng)調(diào)了由運(yùn)算算力,邊緣算力,本地算力共同 構(gòu)成的“泛在”算力,是算力的終極存在形式。 算力當(dāng)前的供需格局決定了,“泛在”或者是“梯度分布”將會是算力最終的呈現(xiàn)方式, 云計(jì)算和邊緣計(jì)算的有機(jī)結(jié)合:“云—邊”一體有望流行。下面我們將從算力的供需角度, 來闡述“泛在”的必要性。

供給端 1:受到量子隧穿效應(yīng)影響和商業(yè)化成本影響,硅基單核芯片制程將在 3nm 達(dá) 到極限。硅基芯片晶體管的柵長在低于 3 納米時極易發(fā)生量子隧穿效應(yīng)(其原理為,當(dāng) 柵長縮小到一定程度的時候,即使沒有加電壓,源極和漏極都接近互通,晶體管便失去 了開關(guān)的作用,因而無法實(shí)現(xiàn)邏輯電路)。因此,通過更加先進(jìn)的納米制程工藝提升單核 芯片性能將面臨技術(shù)上的嚴(yán)峻挑戰(zhàn)。 由于量子隧穿效應(yīng)的存在,3 納米后,單芯片成本將會急劇上升,華為與羅蘭貝格數(shù)據(jù) 顯示,3 納米制程手機(jī)端旗艦級 SoC 單芯片(以高通驍龍 855 為例)成本較 7 納米顯著 增加約 200 美元,高昂的成本將會極大程度制約終端客戶需求,最終降低算力供給的增 加。

即使在能夠接受較高成本的大型數(shù)據(jù)中心等用戶中,處理器性能的提升依舊受到制約, 受存儲、系統(tǒng)、軟件限制(性能)和單位算力功耗顯著上升(功耗)兩大因素影響,芯 片核心數(shù)量將在 128 核達(dá)到上限。根據(jù)羅蘭貝格數(shù)據(jù),現(xiàn)有的馮·諾依曼架構(gòu)下,通過 擬合不同核心數(shù)量的芯片計(jì)算能力樣本數(shù)據(jù),我們發(fā)現(xiàn)多核處理器隨核數(shù)增長,算力增 長的倍數(shù)快速下滑:從 2 核增至 4 核時,總算力可提升 1.74 倍,而當(dāng)核數(shù)由 128 核增 至 256 核時,總算力水平僅能提升已跌破 1.2 倍(1.16X),已顯著喪失經(jīng)濟(jì)性。

在單核性能以及多核提升帶來的雙重壓制下,大型數(shù)據(jù)中心帶來的增量算力邊際增量將 會迅速遞減,而興建大型數(shù)據(jù)中心需要的土地,人力,時間成本將在海量算力時代制約 “集中式”的算力發(fā)展。

供給端 2:算力爆發(fā)的背景下,網(wǎng)絡(luò)性能限制和成本將會導(dǎo)致數(shù)據(jù)中心的算力難以滿足 復(fù)雜場景下的需求。網(wǎng)絡(luò)帶寬及網(wǎng)絡(luò)時延共同決定了網(wǎng)絡(luò)信道的傳輸質(zhì)量,影響到網(wǎng)絡(luò) 算力的發(fā)揮。具體而言,“網(wǎng)絡(luò)化”算力的使用需要經(jīng)歷終端與云端的數(shù)據(jù)雙向傳輸過程, 這段過程是通過網(wǎng)關(guān)、基站、數(shù)據(jù)中心等不同網(wǎng)節(jié)點(diǎn)之間的信道所實(shí)現(xiàn)的,其中信道的 容量決定了傳輸?shù)乃俾?帶寬),信道的長度與材質(zhì)決定了數(shù)據(jù)傳輸?shù)臅r延,兩者共同影 響了數(shù)據(jù)傳輸?shù)男省?/p>

即使隨著當(dāng)今 5G 網(wǎng)絡(luò)加速完善,無論從時延以及容量都相較于 4G 網(wǎng)絡(luò)出現(xiàn)了較大程度 提升,但相對于未來社會的海量數(shù)據(jù)需求來看,完全依靠 IDC 提供算力支撐仍是效率較 低的選擇,無論是智能駕駛對于時延的要求,亦或是傳輸高清視頻圖像等帶來的大額帶 寬成本,都將進(jìn)一步加劇“集中式”算力與“分布式”需求的錯配。

供給端 3:算力高能耗與全球雙碳目標(biāo)之間的矛盾。 隨著芯片制成逐漸接近量子隧穿效應(yīng)發(fā)生的制程,當(dāng)前主流芯片的能效比正在逐漸接近 極限。單位算力功耗在過去 10 多年間經(jīng)歷了顯著下降,但隨著硅基芯片工藝制程提升的 難度凸顯,其進(jìn)一步下探幅度有限,這意味著,等量算力的提升,即將對應(yīng)等量能耗需 求的提升。面對未來百倍的算力需求,高能耗問題將成為人類算力發(fā)展過程中的重要瓶 頸。 同時,隨著我國雙碳目標(biāo)的提出,對于數(shù)據(jù)中心的耗電量,PUE 值都提出了更嚴(yán)格的要 求,截至 2020 年底,中國數(shù)據(jù)中心耗電量已經(jīng)突破 2000 億千瓦時,能耗占全國總用電 量的 2.7%,隨著數(shù)據(jù)中心進(jìn)一步擴(kuò)容,算力需求進(jìn)一步提升,解決數(shù)據(jù)中心能耗問題的 需求也愈發(fā)迫切。在可見的未來,具備低時延特性的核心城市 IDC 供給將進(jìn)一步被壓 縮,如何通過有效的邊緣側(cè)處理手段,使得有限的核心城市算力資源得到充分利用,也 是本輪“算力革命”急需解決的難題。

需求端:智能化社會大潮下,對應(yīng)百倍流量增長需求。隨著以人工智能、物聯(lián)網(wǎng)、區(qū)塊 鏈、AR/VR 等關(guān)鍵信息技術(shù)逐漸成熟,社會中大量智能化場景將得到實(shí)現(xiàn)。根據(jù)羅蘭貝 格報(bào)告,人工智能技術(shù)將推動無人駕駛、智能辦公、智慧醫(yī)療等場景的有效落地,物聯(lián) 網(wǎng)技術(shù)將推動智能消防、智慧工廠、智慧農(nóng)場、智能家居等場景落地,區(qū)塊鏈技術(shù)將推 動應(yīng)用于數(shù)字證書、信息加密等場景落地,AR/VR 技術(shù)則可推動智慧商場、游戲、智慧 課堂等場景落地。這些場景未來將在產(chǎn)業(yè)領(lǐng)域?qū)崿F(xiàn)跨越式發(fā)展、助力各產(chǎn)業(yè)創(chuàng)新、增強(qiáng) 產(chǎn)業(yè)數(shù)字化程度并增強(qiáng)市場活力,在政務(wù)領(lǐng)域幫助政府提升運(yùn)行效率、提高城市管理水平、加強(qiáng)居民生活幸福度,在民生領(lǐng)域推動社會民生保障、創(chuàng)造宜居空間、實(shí)現(xiàn)可持續(xù) 化發(fā)展,共同推動社會向智能社會發(fā)展。

根據(jù)華為《泛在算力報(bào)告》,在人工智能、物聯(lián)網(wǎng)、區(qū)塊鏈、AR/VR 四大領(lǐng)域,到 2030 年,相比 2018 年,都將出現(xiàn)百倍到千倍的算力需求增長,同時對于網(wǎng)絡(luò)的延遲也提出了 更高的要求。

從算力需求看,人工智能技術(shù)對于算力的核心拉動點(diǎn)在于未來各應(yīng)用場景內(nèi)單設(shè)備芯片 算力的增長和人工智能技術(shù)的行業(yè)滲透率的進(jìn)一步提升,物聯(lián)網(wǎng)主要通過低算力物聯(lián)網(wǎng) 設(shè)備的普及、配套云端計(jì)算中心和邊緣端計(jì)算單元的增加共同拉動算力增長,區(qū)塊鏈因安全問題要求的算力持續(xù)增長和應(yīng)用場景的快速普及將帶動以云服務(wù)器為主的算力增長, VR/AR 設(shè)備的普及和普及需要的云計(jì)算中心和邊緣計(jì)算設(shè)備算力配套將共同推動整體算 力的增長。 從時延要求看,L3 級別的自動駕駛對于傳輸時延的要求在 10-20 毫秒,在進(jìn)入 L4&L5 級 別后,對于傳輸時延的要求進(jìn)一步提高到 10 毫秒以下;使用物聯(lián)網(wǎng)建設(shè)智慧工廠對車間 內(nèi)部的局域網(wǎng)絡(luò)帶寬需要達(dá)到 Gbps 級別,最高時延須控制在 5ms-10ms 以內(nèi);在 VR/AR 游戲中,端到端的時延至少需要小于 20 毫秒,才能保證在使用過程中避免感知到明顯的 圖像滯后而導(dǎo)致的眩暈。

由此可見,供給端的單芯片制程、能源限制,傳輸費(fèi)用,與需求端的降本,能耗,時延 所帶來的供需錯配,是算力走向泛在的核心因素。近年以來,我們也看到了中國為了解 決算力調(diào)度問題所作出的努力,其中最具代表性的便是“東數(shù)西算”與三大運(yùn)營商所提 出的“算力網(wǎng)絡(luò)”。 為什么要強(qiáng)調(diào)“東數(shù)西算”或者是“算力網(wǎng)絡(luò)”的重要性,因?yàn)槲覀冋J(rèn)為,脫離了“網(wǎng) 絡(luò)”的邊緣算力是沒有意義的,未來的邊緣算力一定是通過“算力網(wǎng)絡(luò)”,與云端大算力 一起,實(shí)現(xiàn)智能融合與實(shí)時調(diào)度,邊緣預(yù)處理的 token 通過算力網(wǎng)絡(luò),調(diào)用云端算力進(jìn) 行 token,科研機(jī)構(gòu)通過“算力網(wǎng)絡(luò)”調(diào)度系統(tǒng),實(shí)時分配與匹配各類不同的算力需求, 可以說,“算力網(wǎng)”的作用,在 AI 時代,重要程度將不亞于通信網(wǎng)絡(luò)。 當(dāng)前,得益于我國“集中力量辦大事”的優(yōu)勢,在“東數(shù)西算”這一頂層設(shè)計(jì)指揮下, 我國在“算力網(wǎng)絡(luò)”建設(shè)上已經(jīng)取得了領(lǐng)先世界的進(jìn)度。

首先是“東數(shù)西算”,“東數(shù)西算”工程首次提出于 2021 年 5 月 24 日的《全國一體化大 數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實(shí)施方案》,此后,在國務(wù)院發(fā)布的《“十四五”數(shù)字經(jīng) 濟(jì)發(fā)展規(guī)劃》中,也再次將其作為一個重要章節(jié)進(jìn)行部署。 根據(jù)官方解讀,“‘東數(shù)西算’中的‘?dāng)?shù)’,指的是數(shù)據(jù),‘算’指的是算力,即對數(shù)據(jù)的 處理能力?!蔽覈鞑康貐^(qū)資源充裕,特別是可再生能源豐富,具備發(fā)展數(shù)據(jù)中心、承接 東部算力需求的潛力?!皷|數(shù)西算”就是通過構(gòu)建數(shù)據(jù)中心、云計(jì)算、大數(shù)據(jù)一體化的新 型算力網(wǎng)絡(luò)體系,將東部算力需求有序引導(dǎo)到西部,優(yōu)化數(shù)據(jù)中心建設(shè)布局,促進(jìn)東西 部協(xié)同聯(lián)動。簡單地說,就是讓西部的算力資源更充分地支撐東部數(shù)據(jù)的運(yùn)算,更好為 數(shù)字化發(fā)展賦能。

東數(shù)西算布局顯示,整個工程共包含 8 大算力樞紐,承擔(dān)我國算力網(wǎng)絡(luò)的骨干連接點(diǎn), 發(fā)展數(shù)據(jù)中心集群,開展數(shù)據(jù)中心與網(wǎng)絡(luò)、云計(jì)算、大數(shù)據(jù)之間的協(xié)同建設(shè),并作為國 家“東數(shù)西算”工程的戰(zhàn)略支點(diǎn),推動算力資源有序向西轉(zhuǎn)移,促進(jìn)解決東西部算力供 需失衡問題。圍繞每個樞紐節(jié)點(diǎn),都規(guī)劃設(shè)立了 1 至 2 個數(shù)據(jù)中心集群。算力樞紐和集 群的關(guān)系,類似于交通樞紐和客運(yùn)車站。國家發(fā)展改革委創(chuàng)新驅(qū)動發(fā)展中心副主任徐彬 說,數(shù)據(jù)中心集群將匯聚大型、超大型數(shù)據(jù)中心,具體承接數(shù)據(jù)流量。集群將獲得更好 的政策支持、配套保障,同時在綠色節(jié)能、資源利用率、安全保障水平等方面也會有更 嚴(yán)格的要求。

東數(shù)西算工程自 2022 年 2 月正式啟動以來,經(jīng)過超過一年多的準(zhǔn)備,八個國家算力樞 紐節(jié)點(diǎn)已經(jīng)全部開工,正式進(jìn)入全面建設(shè)階段。截止 3 月 17 日,在已經(jīng)開工的 8 個國 家算力樞紐中,今年新開工的數(shù)據(jù)中心項(xiàng)目近 70 個,其中,西部新增數(shù)據(jù)中心的建設(shè)規(guī) 模超過 60 萬機(jī)架,同比翻了一番。至此,國家算力網(wǎng)絡(luò)體系架構(gòu)初步形成。 站在當(dāng)前的 AI 爆發(fā)起點(diǎn),我們再次回看“東數(shù)西算”工程,有道理相信國家的提前布 局,大力投入,將會是我國“算力”實(shí)現(xiàn)高效利用,在 AI 時代搶奪先機(jī)的重要基建。 基于東數(shù)西算體系,“算力網(wǎng)絡(luò)”的建設(shè)就顯得更加順其自然?!八懔W(wǎng)絡(luò)”是當(dāng)前三大 運(yùn)營商建設(shè)的重要方向,三大運(yùn)營商積累了眾多的算力,機(jī)柜資源,如何通過“算力網(wǎng) 絡(luò)”的建設(shè),使得用戶實(shí)現(xiàn)“有網(wǎng)絡(luò)的地方就有算力”,將是運(yùn)營商建設(shè)“AI”時代核心 資產(chǎn)的最重要方向。

中國移動的算力資源網(wǎng)絡(luò)建設(shè)可以用“4+N+31+X”的數(shù)據(jù)中心布局來概括,即 4 熱點(diǎn) 區(qū)域+N 中心節(jié)點(diǎn)+31 省級節(jié)點(diǎn)+X 邊緣節(jié)點(diǎn),中國移動近三年累計(jì)投資近 900 億元,累 計(jì)投產(chǎn)云服務(wù)器 71 萬臺,覆蓋“東數(shù)西算”全部核心樞紐;深化云邊端協(xié)同發(fā)展,實(shí)現(xiàn) 中心云“一省一池”,建成邊緣節(jié)點(diǎn)超 1000 個。

中國電信于 2022 年發(fā)布“云網(wǎng)融合 3.0”,提出六大特征:云網(wǎng)一體、要素聚合、智能 敏捷、安全可信、能力開放、綠色低碳。中國電信在智能算力領(lǐng)域布局相對領(lǐng)先,率先 構(gòu)建“6+31+N+X”的四級 AI 算力架構(gòu),將有力提升天翼視聯(lián)網(wǎng)等重點(diǎn)業(yè)務(wù)的數(shù)智化能 力。 中國聯(lián)通明確推進(jìn)架構(gòu)先進(jìn)、安全可靠、服務(wù)卓越的算力網(wǎng)絡(luò)新布局,為數(shù)字經(jīng)濟(jì)打造 “第一算力引擎”。制定《聯(lián)通算網(wǎng)融合發(fā)展行動計(jì)劃 2022~2025》,提出通過云、網(wǎng)、 邊、端、業(yè)的高效協(xié)同提供算網(wǎng)一體化的新型算力基礎(chǔ)設(shè)施及服務(wù),打造基于算網(wǎng)融合 設(shè)計(jì)的服務(wù)型算力網(wǎng)絡(luò),形成網(wǎng)絡(luò)與計(jì)算深度融合的算網(wǎng)一體化格局,賦能算力產(chǎn)業(yè)發(fā) 展。 從三大運(yùn)營商的布局可以看出,算力體系基本由從中心節(jié)點(diǎn)到邊緣資源池的四層體系構(gòu) 建,這也驗(yàn)證了我們上文所闡述的,算力梯度分布+算力網(wǎng)絡(luò)建設(shè)是未來中國算力的最 終形態(tài),從三家運(yùn)營商的表述中我們也可以看出,“X”即邊緣,是未來我國算力網(wǎng)絡(luò)的 最重要組成部分之一,我們將在下一節(jié)中探討,邊緣算力網(wǎng)絡(luò)資源部署的幾種模式。

4. 邊緣算力,連接 AI 與用戶的紐帶

邊緣計(jì)算,即將計(jì)算資源部署靠近用戶和數(shù)據(jù)源的網(wǎng)絡(luò)邊緣側(cè),通過更靠近數(shù)據(jù)源或者 最終用戶的距離,從而實(shí)現(xiàn)更低的時延、更好的隱私以及更優(yōu)的成本。進(jìn)入大模型時代 以來,我們認(rèn)為邊緣側(cè)的定義應(yīng)隨著 AI 的發(fā)展進(jìn)一步拓展,邊緣計(jì)算應(yīng)該當(dāng)是離模型 推理發(fā)生處最近的算力,或者是幫助云端算力進(jìn)行預(yù)推理的算力。 不同于由超大型數(shù)據(jù)中心與智算中心形式部署的云端算力,邊緣算力的部署形式隨著智 能設(shè)備以及邊緣數(shù)據(jù)中心的出現(xiàn)變得愈發(fā)多樣。我們認(rèn)為,邊緣算力的存在形式主要可 以分為兩類,第一類是通過邊緣算力芯片提供,通過定制 PCB 板輸出,或者通過模組形 式輸出。第二類則更加類似于傳統(tǒng)數(shù)據(jù)中心,通過將機(jī)柜布置在離用戶較近的機(jī)房中, 來獲得類似于本地算力的便捷性。

目前,邊緣算力的存在形式主流是邊緣計(jì)算芯片。從全球來看,邊緣算力芯片巨頭廠商 主要包括了高通、蘋果與英偉達(dá)三大巨頭。其中,蘋果的邊緣芯片主要用于其生態(tài)體系 內(nèi)的如 Iphone、Ipad 等產(chǎn)品內(nèi),英偉達(dá)邊緣產(chǎn)品主要是車側(cè)的自動駕駛芯片如 Orin, 這兩家的體系較為封閉,搭載的產(chǎn)品數(shù)量也較少。而高通作為全球手機(jī)芯片巨頭,基于 驍龍系列手機(jī)芯片推出了一系列專為邊緣側(cè)設(shè)計(jì)的模組芯片,將傳統(tǒng)的 IOT 設(shè)備賦予了 算力,也改變了過去邊緣側(cè)設(shè)備只能基于功耗與成本較高的 X86 平臺的格局。當(dāng)下,主 流的物聯(lián)網(wǎng)算力場景,如智能車機(jī),智能零售等,普遍采用高通芯片來提供算力和搭載 系統(tǒng)。

經(jīng)過多年迭代,高通于今年 4 月推出了最新一代的物聯(lián)網(wǎng)芯片 QCS8550A/QCM8550,處 理器整合強(qiáng)大算力和邊緣側(cè) AI 處理、Wi-Fi 7 連接以及增強(qiáng)圖形和視頻功能,為高性能 需求的物聯(lián)網(wǎng)應(yīng)用提供支持并助力其快速部署,比如自主移動機(jī)器人和工業(yè)無人機(jī)。上 述產(chǎn)品采用了高通優(yōu)化的 AI 架構(gòu)。高通 QCS8550 和高通 QCM8550 還支持增強(qiáng)的視頻 和圖形處理,支持沉浸式云游戲、視頻協(xié)作和視頻流媒體體驗(yàn)。我們認(rèn)為,隨著專為 AI 處理優(yōu)化的 8550 系列芯片的推出,從芯片側(cè)來看,海外巨頭已經(jīng)做好了將 AI 帶入邊 緣側(cè)的基建準(zhǔn)備。

將芯片的視角拉回國內(nèi),國內(nèi)經(jīng)過幾年追趕,也涌現(xiàn)出了許多優(yōu)秀的邊緣芯片提供廠商, 他們聚焦于處理芯片或通信芯片,為邊緣計(jì)算能力的國產(chǎn)替代添磚加瓦。從國內(nèi)主要的 邊緣算力 SOC 提供廠商包括了全志科技、晶晨股份、瑞芯微等廠商,而邊緣通信芯片廠 商則包括了如翱捷科技、樂鑫科技、紫光展銳、移芯科技等廠商。

國內(nèi)的邊緣算力 SOC 廠商采取了與高通不同的發(fā)展策略,更多的走向了綁定大廠,大單 品的形式,從產(chǎn)品設(shè)計(jì)階段開始,深度參與芯片與產(chǎn)品的融合與定制化開發(fā),而高通則 更希望通過將芯片制作成模組,來為全球所有的中小開發(fā)者來提供標(biāo)準(zhǔn)化,易于獲得的 邊緣計(jì)算能力。 國內(nèi)模組廠采用的定制化+大單品策略,一般是指客戶基于邊緣算力芯片,在 PCB 設(shè)計(jì)、 產(chǎn)品功能設(shè)計(jì)階段就與該芯片進(jìn)行綁定,從而設(shè)計(jì)并生產(chǎn)出能夠完美適配芯片的產(chǎn)品,但前期定制 PCB,調(diào)試芯片的費(fèi)用較大,需要用大批量出貨來攤薄成本,并且一旦失敗, 產(chǎn)品開發(fā)者需要承擔(dān)較大的虧損。因此,大量采用國產(chǎn)邊緣算力平臺的廠家一般包括了 如智能音箱廠商、掃地機(jī)器人廠商等具有雄厚實(shí)力的公司。

與國內(nèi)邊緣算力廠商相反,高通憑借其全球市場領(lǐng)先地位,覆蓋了海量的下游應(yīng)用場景 與中小開發(fā)者,因此,高通邊緣算力芯片中,最為重要的一個承載形式模式便是物聯(lián)網(wǎng) 模組。 與偏向定制化的物聯(lián)網(wǎng)芯片不同,物聯(lián)網(wǎng)模組通過對高通算力芯片的預(yù)打包,預(yù)調(diào)試, 使得中小開發(fā)者可以通過開發(fā)板的形式,快速的獲得基于模組的標(biāo)準(zhǔn)化的,穩(wěn)定的通信 能力和邊緣算力。通過較小成本,較短流程的開發(fā),中小開發(fā)者可以利用模組快速完成 產(chǎn)品設(shè)計(jì)和制造,大大縮短了智能設(shè)備的開發(fā)周期。面向海量中小開發(fā)者+細(xì)分領(lǐng)域,我 們認(rèn)為,模組是承載邊緣算力無限想象空間的最佳形式。

上文提到的第二條路線是基于傳統(tǒng)的數(shù)據(jù)中心架構(gòu),將機(jī)房放置在離客戶較近或者離客 戶掌控范圍內(nèi)的邊緣算力部署模式。今年 4 月,上海市經(jīng)濟(jì)信息化委關(guān)于印發(fā)《上海市 推進(jìn)算力資源統(tǒng)一調(diào)度指導(dǎo)意見》的通知中提出,要引導(dǎo)根據(jù)應(yīng)用場景,利用存量通信 機(jī)房、變電站等設(shè)施按需靈活部署邊緣數(shù)據(jù)中心。這便是對于該類邊緣算力的部署模式 的探索。 上海的規(guī)劃中指出的一類邊緣算力部署模式便是在變電站中布置,當(dāng)前,國家電網(wǎng)也在 積極探索利用閑置的變電站土地資源,探索“多站融合”的機(jī)會,其中就包括了基于變 電站的邊緣數(shù)據(jù)中心建設(shè)。早在 2020 年 4 月,國網(wǎng)首個戶外式大中型多站融合數(shù)據(jù)中 心交付,蘭州 110 千伏砂坪變多站融合數(shù)據(jù)中心是以該變電站可復(fù)用站址資源,改建 632 平米舊倉庫而成,共投產(chǎn) 7 千瓦機(jī)柜 172 面。

當(dāng)前,邊緣算力的需求方或者部署地往往是核心城市的市中心或熱點(diǎn)地區(qū),受制于核心 城市能耗指標(biāo),土地空間等因素影響,再額外興建大型數(shù)據(jù)中心難度極大,因此結(jié)合如 變電站等閑置資源再開發(fā),將是擴(kuò)充我國邊緣算力池的良好路徑。 我們從 A 股上市公司年報(bào)中,發(fā)現(xiàn)了正在上海積極布局邊緣計(jì)算的公司龍宇股份,公司 年報(bào)披露,公司基于前期的資源推進(jìn)和布局規(guī)劃,圍繞城市智慧發(fā)展以及相關(guān)行業(yè)的數(shù) 字化轉(zhuǎn)型發(fā)展需求,前瞻布局邊緣計(jì)算 IDC 細(xì)分領(lǐng)域,攜手相關(guān)合作伙伴和在上海中心 城區(qū)及五大新城逐步落實(shí)資源布點(diǎn),逐步形成行業(yè)先發(fā)優(yōu)勢。同時,根據(jù)邊緣算力中心 單一規(guī)模較小且分布較廣的特點(diǎn),積極探索業(yè)務(wù)在分布式 IT 技術(shù)架構(gòu)、網(wǎng)絡(luò)布局、智能 運(yùn)營領(lǐng)域的創(chuàng)新模式,逐步搭建邊緣算力網(wǎng)絡(luò)架構(gòu)。 梳理本段,我們認(rèn)為,未來邊緣算力將呈現(xiàn)設(shè)備本地算力+邊緣算力池雙線并行的發(fā)展 方式,中國的模組公司作為全球具有比較優(yōu)勢的企業(yè),有望充分讓中國制造賦能“全球 邊緣”,而中國的邊緣芯片公司,有望加速國產(chǎn)替代進(jìn)程,讓“中國邊緣算力”加速滲透。 而 IDC 公司,則有望憑借邊緣算力池的模式,通過邊緣算力獨(dú)有的優(yōu)勢,實(shí)現(xiàn)算力調(diào)度 收費(fèi),低時延優(yōu)化收費(fèi)等全新商業(yè)模式,打開行業(yè)發(fā)展空間。

5. 應(yīng)用曙光已現(xiàn),期待 AI 飛輪下的百花齊放

當(dāng)下市場以及投資者關(guān)注的應(yīng)用方向,主要集中于基于云端算力的如 CHATGPT, Midjourney,Copilot 等等,而提起邊緣智能設(shè)備或者邊緣應(yīng)用時,則更多的將其作為一 種“入口”,或是直接忽略“邊緣算力”與 AI 結(jié)合的可能。 其實(shí) AI 在邊緣側(cè)的應(yīng)用或者“滲透”由來已久,其中最典型的案例便是如人臉識別,圖 像處理等分析式 AI 功能。我們?nèi)粘I钪幸姷降娜缱詣玉{駛,智能零售、智慧工廠、智 能巡檢等場景均是由邊緣或者本地端提供算力進(jìn)行解決。如英偉達(dá)的 Orin,地平線等公 司的智能駕駛芯片,就是邊緣算力運(yùn)行 AI 模型的例子,自動駕駛芯片通過每秒分析上千 幀畫面,來保證車輛對前方路況的理解并做出相應(yīng)反應(yīng)。同時,模組廠商也在積極探索 如何讓模組算力更好的參與進(jìn)車輛自動駕駛功能中來,如美格智能最新的 C-V2X MA925 系列模組,在幫助 T-BOX 與外界通信的同時,自身搭載的算力能夠提供 GNSS 服務(wù),并 能夠內(nèi)生解決 V2X 的運(yùn)行,讓 T-BOX 不再需要額外掛載處理芯片。

相比于需要利用高算力進(jìn)行智能駕駛的乘用車,當(dāng)下,許多小型無人設(shè)備的自動駕駛正 在越來越多的依靠模組來提供相關(guān)功能所需要的算力。如國內(nèi)大型工業(yè)無人機(jī)廠商云圣 智能的“虎鯨Ⅲ”全自主工業(yè)無人機(jī),就搭載了美格智能 5G 工業(yè)級通信模組 SRM815, 利用“機(jī)器人+人工”相結(jié)合的方式,可實(shí)現(xiàn)電力通道巡檢,電力本體巡檢,三維實(shí)景建 模等功能,模組在其中起到了如視頻解析,傳輸,操控信號低時延傳輸?shù)裙δ堋?/p>

智能零售場景則是不同功能模組實(shí)現(xiàn)了如無人零售、自助結(jié)算、商品管理等功能。如美 格智能的通過對高通模組的理解與定制化開發(fā),為客戶在如無人售賣柜、人臉支付、智 能收銀機(jī)。智能 POS 等方面推出了完整的解決方案。其中無人零售設(shè)計(jì)的人臉識別,圖 像識別等,也是基于高通 14NM 芯片提供的算力進(jìn)行部署。

一種更為通用的邊緣算力應(yīng)用,采用“邊緣算力盒子”的形式進(jìn)行呈現(xiàn),相比于設(shè)備內(nèi) 部搭載的邊緣計(jì)算芯片,邊緣計(jì)算盒子擁有更高的環(huán)境容忍度、更好的物理體積,更好 的散熱,以及更大的算力部署能力,“邊緣算力盒子”往往放置在如工廠產(chǎn)線、電線桿、 路燈等場景,用來支撐如產(chǎn)線質(zhì)檢、智慧城市、V-2X 等 AI 應(yīng)用場景。 甚至,以模組形式承載的邊緣算力,已經(jīng)進(jìn)入了數(shù)據(jù)中心,作為云算力的一部分為用戶 提供服務(wù)。實(shí)時互動云創(chuàng)新服務(wù)商啟朔科技,就利用刀片式服務(wù)器承載算力模組,實(shí)現(xiàn) 了 2U 機(jī)柜內(nèi)部署 80 顆高通算力芯片,從而為云游戲、數(shù)字人渲染、工業(yè) AI 檢測等場 景提供算力。當(dāng)前啟朔科技已經(jīng)成為了阿里云,網(wǎng)易游戲等的合作伙伴。

我們在這一段的前半部分,總結(jié)了當(dāng)下邊緣算力應(yīng)用的主流形式,其中已經(jīng)有了非常多 偏 AI 運(yùn)算的需求,但我們不難發(fā)現(xiàn),當(dāng)前運(yùn)行在邊緣端的 AI 模型,更多的是以傳統(tǒng)的 圖像識別形式存在的“分析型”AI,而我們認(rèn)為,真正能夠讓邊緣算力需求擴(kuò)張,或者 打開邊緣 AI 天花板的“生成式”AI,則是下一階段乃至未來需要在邊緣應(yīng)用側(cè)更加關(guān)注 的重點(diǎn),在“生成式”AI 在邊緣設(shè)備的部署上,我們更愿意用本段標(biāo)題中的“曙光初現(xiàn)” 來形容,各個大廠的先期產(chǎn)品和布局讓我們看到了“生成式”走進(jìn)邊緣的路徑和初步方 案,接下來,我們將會介紹兩大方向,并闡述為什么邊緣算力對這些場景是不可或缺的。

邊緣應(yīng)用方向 1:基于生成式模型的“智能助理”。 智能助理這一概念,最早火爆,是伴隨“SIRI”的推出,消費(fèi)者第一次系統(tǒng)性的認(rèn)識到 了基于語音喚醒的智能助理這一概念。然而隨著多年發(fā)展,這一形式的智能助理除了搭 載平臺擴(kuò)充到了如車機(jī)、智能音響、掃地機(jī)器人等平臺外,其本質(zhì)內(nèi)核仍然沒有改變, 依舊是基于對語音輸入關(guān)鍵詞的截取,在功能庫中尋找對應(yīng)的功能。并不具備主動生成 的能力。 我們認(rèn)為,生成式 AI 將給“智能助理”這一應(yīng)用方向帶來重大改變,隨著 ChatGPT 為 代表的大模型與“智能助理”融合,智能助理將變得更加擬人化,能夠增強(qiáng)對于命令的 理解性和執(zhí)行能力,給出的回饋也將更加優(yōu)秀,而不會出現(xiàn)當(dāng)下智能助理經(jīng)常出現(xiàn)的“不 能理解您的意思”的情況。 第二,大模型的引入,將能夠更好的方便“智能助理”的用戶的生活習(xí)慣,行動軌跡, 以及保存在設(shè)備上的資料進(jìn)行總結(jié),從而給出更符合用戶實(shí)際需求的答案,能夠成為幫 助提高學(xué)習(xí),工作效率的幫手。

第一種應(yīng)用場景,我們已經(jīng)看到了很多的積極變化,首先是小度科技融合文心一言打造 的針對智能設(shè)備場景的人工智能模型“小度靈機(jī)”,還有天貓精靈接入“鳥鳥分鳥”模型 打造“AI 嘴替”,并官宣將接入阿里大模型通義千問。在車機(jī)方面,我們也看到了模型接 入車機(jī)的進(jìn)展,當(dāng)前,上汽旗下的斑馬智行 AliOS 智能汽車操作系統(tǒng)已接入通義千問大 模型進(jìn)行測試。而四季度將發(fā)布的問界 M9 也將搭載大模型。

5 月 18 日,OpenAI 官方正式推出運(yùn)行于的 ChatGPT,用戶可以以手機(jī)為接口直接訪問 有了它,用戶可以輸入問題并接收來自聊天機(jī)器人的回復(fù)。根據(jù) OpenAI 的介紹,這款 APP 還包括語音識別功能,因此用戶可以說出他們的問題。然而,機(jī)器人只會以書面形 式回應(yīng)。該應(yīng)用程序還可以跨各種設(shè)備同步基于文本的對話。進(jìn)一步強(qiáng)化了手機(jī)的“智 能助理角色”。

第二種應(yīng)用場景,我們觀察到了海外爆火的應(yīng)用“Rewind”,通過記錄筆記本電腦的屏幕 輸出信號與麥克風(fēng)信號,并形成數(shù)據(jù)庫,最后基于這些數(shù)據(jù)庫與自有模型,幫助用戶回 憶,總結(jié)在電腦上看到的,處理過的所有資料,大大提高了用戶的工作效率。

基于兩點(diǎn)應(yīng)用方向和現(xiàn)在出現(xiàn)的應(yīng)用趨勢,我們判斷,邊緣算力將在“智能助理”類應(yīng) 用的發(fā)展和商業(yè)化上起到重要作用,第一,智能助理面對的是海量用戶,這些用戶所提 出的 Prompt 將是及其復(fù)雜或者存在非常多的冗余,如何通過本地小模型,對用戶的需 求進(jìn)行預(yù)處理,從而將需要云端算力處理的 Token 將至最低,甚至對于不復(fù)雜的推理需 求,可以通過本地算力直接響應(yīng)客戶需求。第二,對于像“Rewind”這類涉及到用戶隱 私資料的部分,為了保證用戶安全,所有的數(shù)據(jù)歸納將會完全依靠本地算力進(jìn)行。因此, 在降本,隱私方面,邊緣算力對于“生成式智能助理”能否形成商業(yè)閉環(huán),至關(guān)重要。

邊緣應(yīng)用方向 2:具身智能。 具身智能是指能夠理解、推理并與物理世界互動的智能系統(tǒng)。AIGC 的“智能”表現(xiàn)在能 夠進(jìn)行上下文理解和情景感知,輸出文字、圖像、聲音,而具身智能能夠在物理世界中 進(jìn)行操作和感知,輸出各種機(jī)械動作。通過物理環(huán)境的感知和實(shí)際操作,具身智能可以 獲得更全面的信息和數(shù)據(jù),進(jìn)一步提高對環(huán)境的理解和決策能力。按照具身智能的定義, 目前具身智能的實(shí)例繁多,其中包括人形機(jī)器人、自動駕駛汽車等。 當(dāng)下,例如特斯拉推出的人形機(jī)器人 Optimus、波士頓動力的 Atlas 和 Spot 已經(jīng)具備接 近具身智能的能力,它們可以通過機(jī)器人的身軀來模擬人類或動物的行為和動作,更加 逼真地與人類進(jìn)行互動。算法側(cè),特斯拉的 Dojo AI 超級計(jì)算機(jī)項(xiàng)目用于加速訓(xùn)練和推 理具身智能模型,英偉達(dá)的多模態(tài) VIMA 可以驅(qū)動機(jī)器人識別物體并做出動作。我們認(rèn) 為,具身智能憑借物理反饋、物理輸出的特性,將是繼 AIGC 之后的又一個現(xiàn)象級 AI 應(yīng) 用。

基于現(xiàn)在具身智能展現(xiàn)出的能力,我們認(rèn)為,具身智能的兩大核心是負(fù)責(zé)算力的芯片和 與外部通信的模組。當(dāng)前物聯(lián)網(wǎng)模組進(jìn)入智能化時代,集成了邊緣算力的智能模組正在 逐漸成為支撐邊緣算力的核心形式。具身智能將邊緣算力需求提升到了一個新高度,具 身智能的“大腦”不僅要處理視覺信息、生成提示詞,更要負(fù)責(zé)輸出指令來執(zhí)行機(jī)械動 作。 例如特斯拉針對人形機(jī)器人開發(fā)了 DOJO D1 芯片,充沛的算力驅(qū)動 Optimus 機(jī)器人流暢地執(zhí)行各種任務(wù)。因此我們認(rèn)為,在移動芯片無法滿足所需算力 的場景下,邊緣 IDC 將是算力的有效補(bǔ)充措施。

此外,通信能力也是決定機(jī)器人能力的核心。具身智能的通信強(qiáng)調(diào)低時延、多連接、連 續(xù)性能力,例如自動駕駛汽車上,L4 級別需要帶寬>100 Mbps,時延 5-10ms。具身智 能未來也有望進(jìn)化成結(jié)構(gòu)復(fù)雜、體型龐大或者多點(diǎn)分布的產(chǎn)品,各子模塊之間需要信息 融合、多維感知、協(xié)同運(yùn)行,本身也會需要穩(wěn)定高速的無線連接。我們認(rèn)為,未來具身 智能將會越來越強(qiáng)調(diào)邊緣通信能力與邊緣算力的匹配和耦合,而兩者結(jié)合的最好形式, 算力模組,將有望成為具身智能的“大腦”。 站在當(dāng)前時點(diǎn),我們認(rèn)為,除了已經(jīng)日趨成熟的基于傳統(tǒng)分析式人工智能的邊緣算力應(yīng) 用場景,我們更應(yīng)該關(guān)注到生成式 AI 在邊緣滲透的“曙光”已經(jīng)出現(xiàn)。未來,越來越多 像智能助理、具身智能一樣擁有廣闊空間的新應(yīng)用將會涌現(xiàn),帶動邊緣算力實(shí)現(xiàn)跨越式 發(fā)展。

熱門文章
北京——2023年5月22日 亞馬遜云科技日前宣布存儲優(yōu)化型實(shí)例Amazon EC2 I4g正式可用,該實(shí)例基于亞馬遜云科技自研芯片Amazon Gravtion2,與上一代存儲優(yōu)化型實(shí)例相比實(shí)時存儲
2023-05-22
X
郧西县| 城口县| 广东省| 临洮县| 拜城县| 林芝县| 宁都县| 米泉市| 尼玛县| 花垣县| 昌都县| 金沙县| 新郑市| 盐山县| 苗栗市| 汝南县| 沧源| 普格县| 张家界市| 湖口县| 察隅县| 朝阳区| 太仓市| 新巴尔虎右旗| 三明市| 灵武市| 来宾市| 郧西县| 海伦市| 黄大仙区| 西丰县| 股票| 赤城县| 达孜县| 乾安县| 银川市| 镇远县| 平定县| 盐源县| 锡林郭勒盟| 呈贡县|