機(jī)器人作為典型的智能硬件產(chǎn)品,在過去很長一段時(shí)間里,其商業(yè)落地表現(xiàn)并不是那么智能。從以往傳統(tǒng)機(jī)器人的局限性來看,可以將其歸類為:環(huán)境感知薄弱,單模態(tài)傳感器孤立運(yùn)作,缺乏多模態(tài)融合算法與抗干擾硬件;交互淺層化,依賴預(yù)設(shè)交互規(guī)則且只能捕捉有限的狀態(tài),缺乏語義理解與上下文記憶能力;本地處理能力有限,機(jī)器人端側(cè)算力匱乏導(dǎo)致部分決策延遲,無法精細(xì)處理多模態(tài)數(shù)據(jù);決策邏輯剛性,缺乏動(dòng)態(tài)優(yōu)化策略與實(shí)時(shí)決策能力。這也就導(dǎo)致了傳統(tǒng)機(jī)器人在非結(jié)構(gòu)化的場景中感知交互無法做得更有深度,在實(shí)踐中幾乎很難在“長尾場景”泛化應(yīng)用。
隨著感知技術(shù)、運(yùn)控技術(shù)、計(jì)算能力的逐步提升,以及AI模型快速迭代并在端側(cè)加速落地,機(jī)器人行業(yè)迎來了重大變革。特別是具身智能概念興起后,眾多企業(yè)紛紛入局具身智能賽道,同時(shí)今年政策層面對(duì)具身智能概念的高度關(guān)注,更標(biāo)志著這一技術(shù)已成為科技競爭的“關(guān)鍵領(lǐng)域”。
在頂層政策的助推和企業(yè)們的積極布局下,國內(nèi)具身智能產(chǎn)業(yè)正呈現(xiàn)蓬勃發(fā)展之勢(shì)。具身智能機(jī)器人作為智能硬件與人工智能的集大成者,開始帶領(lǐng)機(jī)器人行業(yè)走向智能化的拐點(diǎn)。具身智能通過硬件智能體與環(huán)境的交互來獲取信息、理解問題、做出決策并執(zhí)行行動(dòng),從而展現(xiàn)出智能行為和適應(yīng)性。傳統(tǒng)的人工智能通常依賴于抽象的符號(hào)計(jì)算,而具身智能更強(qiáng)調(diào)通過物理身體的感知、運(yùn)動(dòng)以及與外部環(huán)境的交互來實(shí)現(xiàn)認(rèn)知,并基于這些認(rèn)知實(shí)現(xiàn)高階自主智能。
作為集前沿科學(xué)技術(shù)于一身的產(chǎn)品,具身機(jī)器人的感知層、決策層、執(zhí)行層等每一類技術(shù)框架里都有著大量可智能化的空間。多模態(tài)具身感知是傳統(tǒng)機(jī)器人向具身機(jī)器人升級(jí)的重要一環(huán),是具身智能機(jī)器人的基礎(chǔ)能力。具身智能機(jī)器人需要一整套完整的多模態(tài)具身感知系統(tǒng),通過多維度的感知數(shù)據(jù)收集,帶動(dòng)運(yùn)動(dòng)控制的范式變化。
在不久前的2025 MWC上海期間,移遠(yuǎn)通信與逐際動(dòng)力聯(lián)合發(fā)布了突破性的Robrain AI機(jī)器人解決方案,該方案采用創(chuàng)新的端云協(xié)同架構(gòu)及麥克風(fēng)陣列拾音技術(shù),深度融合端側(cè)智能與云端大模型優(yōu)勢(shì),賦予機(jī)器人接近人類的“思考”與“傾聽”能力,將機(jī)器人感知能力升維成具身感知。
該方案已在逐際動(dòng)力LimX Dynamics的明星產(chǎn)品——多形態(tài)雙足機(jī)器人TRON 1上成功落地,有效攻克了AI模型定制、輕量化部署及低延遲交互響應(yīng)等關(guān)鍵挑戰(zhàn),推動(dòng)機(jī)器人從“機(jī)械執(zhí)行”躍升為“主動(dòng)感知、智能思考、自然交流”的AI智能體。
機(jī)器人的語音感知交互一直都有幾大難點(diǎn),一是全向的遠(yuǎn)場拾音難,二是動(dòng)態(tài)場景噪聲源多,此外機(jī)器人自身運(yùn)動(dòng)時(shí)零部件也會(huì)產(chǎn)生噪聲干擾語音抓取。Robrain AI采用先進(jìn)的4/6麥克風(fēng)陣列算法,通過空域?yàn)V波技術(shù)形成定向拾音波束,能有效抑制環(huán)境噪聲,增強(qiáng)聲源方位人聲,在嘈雜環(huán)境中依然能夠精準(zhǔn)捕捉聲源。移遠(yuǎn)通信在感知層應(yīng)用的ASR模型,通過大量自研的端側(cè)全鏈路語音處理算法,保證前端聲學(xué)處理的高質(zhì)量,為模型的精準(zhǔn)識(shí)別提供了保障,賦予了機(jī)器人敏銳的“聽覺”。

在敏銳感知的基礎(chǔ)上,如何讓決策交互更有溫度,也是衡量機(jī)器人智能化與商業(yè)價(jià)值的核心標(biāo)尺。這就需要給機(jī)器人配置具備思考推理、深度理解語義的大小腦,幫助機(jī)器人真正理解這個(gè)世界,對(duì)人類發(fā)出的指令進(jìn)行拆解、邏輯推理和規(guī)劃決策。對(duì)于具身智能機(jī)器人這一類前沿智能硬件來說,模型技術(shù)是其愿景實(shí)現(xiàn)的基石,要想充分發(fā)揮出模型大腦的優(yōu)勢(shì)并不是那么容易。
移遠(yuǎn)通信的Robrain AI機(jī)器人解決方案,基于對(duì)AI工程化技術(shù)的深度適配與持續(xù)優(yōu)化,圍繞移遠(yuǎn)AI模組及其強(qiáng)大算力,構(gòu)建起了端側(cè)與云端大模型的深度協(xié)同體系。云端大模型充分發(fā)揮其豐富數(shù)據(jù)儲(chǔ)備的優(yōu)勢(shì),機(jī)器人可無縫接入豆包、DeepSeek 等主流云端大模型及專業(yè)搜索工具,增強(qiáng)深度語義理解與推理能力,解決交互淺層化局限。
端側(cè)模型主打本地實(shí)時(shí)推理,賦予機(jī)器人毫秒級(jí)的響應(yīng)能力和可靠的離線功能。無論是前進(jìn)、轉(zhuǎn)向、原地踏步、站起、蹲下等動(dòng)作指令,還是企業(yè)專屬領(lǐng)域的專業(yè)問答需求,機(jī)器人都能瞬間給出反饋。同時(shí),該方案還支持企業(yè)定制化知識(shí)庫的本地部署,即便處于離線狀態(tài),機(jī)器人依然可以提供專業(yè)、準(zhǔn)確的問答服務(wù)。在模型效率和精度上,針對(duì)端側(cè)模型AI智能的損失,移遠(yuǎn)通信還運(yùn)用向量數(shù)據(jù)庫、RAG、模型微調(diào)等一系列技術(shù)加以補(bǔ)償,以提升端側(cè)的智能化程度。
在端側(cè)與云端大模型的深度協(xié)同下,Robrain AI機(jī)器人解決方案在情景理解、知識(shí)融合、智能交互、快速響應(yīng)上實(shí)現(xiàn)了明顯的智能化提升,這是以往弱交互、弱推理的機(jī)器人所欠缺的,使得機(jī)器人得以在非結(jié)構(gòu)化的場景中實(shí)現(xiàn)深度擬人的感知與交互,在實(shí)踐中快速在“長尾場景”中泛化應(yīng)用。

正如逐際動(dòng)力聯(lián)合創(chuàng)始人龐博所言,“通過接入移遠(yuǎn)通信的Robrain AI機(jī)器人解決方案,我們的雙足機(jī)器人具備出色的端側(cè)性能,在復(fù)雜環(huán)境中也能快速響應(yīng)、精準(zhǔn)交互,顯著提升了產(chǎn)品的泛化能力與市場落地潛力。”

據(jù)悉,目前Robrain AI能提供兩種具體解決方案,第一種是快速融合的方案,在機(jī)器人本體之外,提供單獨(dú)的機(jī)器人大腦,方案各個(gè)模塊相對(duì)獨(dú)立,方便快速整合,讓傳統(tǒng)機(jī)器人具備大腦決策以及語音交互能力。另一種是深度融合方案,整合度會(huì)更高,一體化的軟硬件設(shè)計(jì)可靠性也更高,適合需要深度整合具身智能場景應(yīng)用的機(jī)器人。
從感知、到?jīng)Q策到交互執(zhí)行,Robrain AI構(gòu)筑起了一套完整的閉環(huán)智能方案,通過技術(shù)的深度協(xié)同與端云數(shù)據(jù)的高效流轉(zhuǎn),讓機(jī)器人真正擁有“觀察世界、思考問題、解決問題”的能力?;跍?zhǔn)確全面的感知與個(gè)性化的決策,Robrain AI 將機(jī)器人的AI能力真正落地到可實(shí)踐的路徑下。這種全鏈路的智能化,讓機(jī)器人不再是機(jī)械的程序執(zhí)行者,而是能夠理解意圖、主動(dòng)行動(dòng)的具身智能體。
在具身智能行業(yè)升級(jí)的拐點(diǎn),Robrain AI為機(jī)器人產(chǎn)業(yè)帶來的價(jià)值遠(yuǎn)不止單純的技術(shù)升級(jí)這一維度。對(duì)機(jī)器人行業(yè)來說,在長尾場景泛化應(yīng)用成為了其商業(yè)化落地難題,已經(jīng)困擾了行業(yè)多年。如何將Robrain AI推廣到工業(yè)、商用、服務(wù)類等細(xì)分場景,成為了加速機(jī)器人產(chǎn)業(yè)變革的關(guān)鍵。
Robrain AI帶來的語音深度交互體驗(yàn),解決了情感化響應(yīng)長期以來的缺失,提升了人機(jī)交互親和力;其在復(fù)雜場景表現(xiàn)出的適應(yīng)性,在解決機(jī)器人場景應(yīng)用泛化性上向前踏出了一大步;加上方案中端云協(xié)同的優(yōu)化算力分配,既降低了云端依賴,讓機(jī)器人走入更多應(yīng)用場景成為可能,還提升響應(yīng)速度與經(jīng)濟(jì)性,平衡了成本與效率,加速了機(jī)器人向更多應(yīng)用場景滲透。這些以場景落地為出發(fā)的技術(shù)賦能,既推動(dòng)了機(jī)器人從“機(jī)械執(zhí)行”到“靈魂覺醒”的躍遷,更加速了機(jī)器人向具身智能終局發(fā)展。
值得一提的是,移遠(yuǎn)通信在設(shè)計(jì)這一機(jī)器人方案時(shí),已經(jīng)考慮到機(jī)器人不斷進(jìn)化的可能性。搭載移遠(yuǎn)通信AI算力模組的Robrain AI機(jī)器人解決方案,能夠?yàn)楦鞣N形態(tài)以及不同場景的機(jī)器人去做定制,并不斷通過端到端的AI技術(shù)為其提供功能進(jìn)化,以場景需求為錨點(diǎn),推動(dòng)機(jī)器人的應(yīng)用走進(jìn)千行百業(yè)。圍繞具體場景的具身智能需求來構(gòu)建AI技術(shù)棧,無疑是推動(dòng)具身智能時(shí)代到來最核心的命題,對(duì)移遠(yuǎn)通信來說如此,對(duì)整個(gè)產(chǎn)業(yè)鏈來說亦是如此。
在近期的直播中,移遠(yuǎn)通信分享了此前落地案例,如基于移遠(yuǎn)通信端側(cè) AI 整體解決方案,采用AI高算力模組SG885G-WF打造的德壹全能王 AI 具身機(jī)器人,能夠在無需理療師介入、無網(wǎng)絡(luò)連接的環(huán)境下,快速且準(zhǔn)確地理解用戶通過自然語言提出的指令和意圖,高效完成通用聊天、醫(yī)療領(lǐng)域 RAG 問答、指令控制等任務(wù)。
在清掃類機(jī)器人、陪伴類機(jī)器人、教育類機(jī)器人、運(yùn)輸類機(jī)器人等多元領(lǐng)域,移遠(yuǎn)通信也在加速布局,依托端云深度協(xié)同的靈魂大腦與感知、AI、通信全技術(shù)棧布局,推動(dòng)不同應(yīng)用方向的機(jī)器人實(shí)現(xiàn)智能化躍遷。

對(duì)于帶有執(zhí)行功能的具身機(jī)器人終端設(shè)備來說,未來進(jìn)一步構(gòu)建多模態(tài)具身大模型是通往高階智能的必經(jīng)之路。與此同時(shí),多模態(tài)模型和硬件算力的適配,則是能否真正應(yīng)用起具身大模型能力的重點(diǎn),也是推進(jìn)具身機(jī)器人落地的關(guān)鍵。
移遠(yuǎn)通信在近期的直播中也透露,其方案規(guī)劃也是按照從多模態(tài)感知到規(guī)劃、決策能力的增強(qiáng)方向推進(jìn),通過不斷擴(kuò)展端到端AI的工程化能力,提高方案的適用性和覆蓋面,為客戶提供一站式的具身機(jī)器人解決方案,加速機(jī)器人具身智能終局到來。
Robrain AI機(jī)器人解決方案給產(chǎn)業(yè)鏈上下游帶來了一個(gè)協(xié)同合作的契機(jī),各方可憑借各自技術(shù)專長,攜手持續(xù)探索機(jī)器人的應(yīng)用場景。在模型技術(shù)、多模態(tài)交互感知技術(shù)、運(yùn)控技術(shù)等一系列前沿科技的加持下,具身智能機(jī)器人的發(fā)展正在推動(dòng)AI向能夠理解、推理并與物理世界互動(dòng)的方向演進(jìn)。正如英偉達(dá)黃仁勛所說,AI技術(shù)終局在物理AI,AI時(shí)代下一個(gè)浪潮是“具身智能”時(shí)代。