這是我的第379篇專欄文章。
7月10日,由物聯(lián)網智庫、智次方聯(lián)合凱文教育集團旗下北京??扑紕?chuàng)發(fā)起的“2025數(shù)智融合領袖峰會”在北京盛大開幕。本次峰會以“潮啟東方·新質領航”為主題,匯聚產、學、研領域頂尖專家與行業(yè)領袖,深度探討人工智能驅動下的產業(yè)變革路徑,共同推動產業(yè)發(fā)展,與國家新質生產力戰(zhàn)略同頻共振。
我在會上帶來了主題為《從通用智能到場景智能:垂類模型與智能體的產業(yè)落地路徑》的分享,以下為演講全文:

各位朋友大家好,這次我想跟大家分享一個我認為非常重要、也非常關鍵的主題——從通用智能到場景智能,垂類模型與智能體的產業(yè)落地路徑。

目前一個值得關注的趨勢在悄然發(fā)生:AI不再只是一個云端工具,開始成為一個“在場”的智能體,而物聯(lián)網正塑造AI在實體世界的運行框架。
今天的演講,包含5個部分:
1.范式轉變:從通用智能到場景智能2.“場景智能” 是通用智能的結構重構3.技術底座:雙引擎與四板塊4.商業(yè)重構:穩(wěn)定幣與機器經濟5.生態(tài)戰(zhàn)略:從工具到平臺的演化

范式轉變:從通用智能到場景智能

在過去一年里,我們見證了AI技術以令人眩目的速度演進:大模型從百億參數(shù)沖向萬億參數(shù),生成式AI從文本走向多模態(tài)。

大家有沒有體驗過讓ChatGPT幫忙寫一封郵件,寫得非常漂亮,但我還是要自己復制、粘貼、打開郵箱、查找聯(lián)系人、發(fā)送?它是不是“聰明”?當然。但它是不是“實用”?未必。
這正是大模型落地時遇到的第一道墻:它能理解,但它不能執(zhí)行。AI“能說話”但是不一定“能干活”。

AI落地的現(xiàn)狀與挑戰(zhàn),這當中涉及到通用智能與場景智能之間的鴻溝。
通用智能:聚焦語言理解和內容生成,依賴大算力、大語料,擅長對話、寫作、創(chuàng)作,但難以理解行業(yè)流程與物理邏輯。
場景智能:針對特定行業(yè)和任務,植入業(yè)務語義和流程邏輯,可部署在邊緣,真正進入“能干活”的階段。
ChatGPT能說話,但不能干活。企業(yè)用AI,不要“演示效果”,而要“現(xiàn)場效果”。AI,不再只是一個云端工具,而應成為一個“在場”的智能體。

“熱”不代表“成熟”,“強”不代表“適配”。
打個比方:大學教授懂得很多知識,但他未必能修好一臺車;一個汽修工人可能學歷不高,但能在5分鐘內判斷問題、拿出工具、完成修復。
這就是“懂知識”和“懂場景”的區(qū)別。在AIoT世界中,我們要的不是“能寫論文的AI”,而是“能換輪胎的AI”。

今天的演講,我希望帶大家從五個問題出發(fā),逐步走進AIoT智能體的真實世界:
1.為什么大模型不能直接落地?2.“場景智能”到底意味著什么?3.智能體的發(fā)展路徑是怎樣的?4.AIoT落地的底層支撐是什么?5.未來的關鍵控制點在哪里?

我們過去一直在說“通用智能”,現(xiàn)在又說“場景智能”,它們是什么關系?
這里我想強調一個觀點:場景智能不是通用智能的簡化版本,而是AI認知結構的重塑。

我們看到通用模型在C端世界非常驚艷,能寫詩、畫畫、聊天,但一旦進入產業(yè)場景,問題就變了。
為什么通用大模型到了產業(yè)場景里“水土不服”?
因為產業(yè)不是語文題,它是物理題。它不是開放世界,而是高度約束的封閉系統(tǒng)。它的核心不是生成內容,而是控制變量、保障穩(wěn)定、優(yōu)化效率。
所以產業(yè)AI的未來,一定屬于垂類模型。
為什么?因為通用大模型存在三個結構性障礙:
1.成本高昂:推理成本遠高于傳統(tǒng)系統(tǒng),難以部署到終端;2.泛用性強但不懂行業(yè):缺乏對具體業(yè)務語義、流程、上下文的理解;3.執(zhí)行能力缺失:無法“動手”,只能“動嘴”。
正如GPT-4處理原始傳感器數(shù)據時,其活動識別準確率僅為40%,機器診斷準確率不足50%——遠低于工業(yè)場景要求。這不是參數(shù)不夠,而是“場景理解力”不足。
產業(yè)AI不是“參數(shù)戰(zhàn)爭”,而是“閉環(huán)戰(zhàn)爭”——誰能跑通數(shù)據-模型-決策-反饋的閉環(huán),誰就能沉淀出“場景智能”。
通用大模型是AI的“百科全書”,垂類小模型將成為產業(yè)的“操作手冊”。類似的,產業(yè)智能體不是單純的技術革新,而是一場系統(tǒng)性的轉型。

這一頁我們來明確一個重要但易被混淆的概念:AI智能體≠AIoT智能體。
今天我們講“智能體”,但不是所有智能體都一樣。
我們先來看左邊這個大家熟悉的角色——AI智能體。這類智能體擅長什么?
擅長語言理解、知識推理;
擅長對話互動、內容生成;
它們部署在云端,需要強大的算力支持;
但它們沒有“手腳”——不能感知物理世界,也無法執(zhí)行具體動作。
所以,AI智能體的核心價值,是“認知”。
而我們今天真正關心的,其實是右邊這個詞:AIoT智能體。
AIoT智能體的核心,不只是認知,而是“認知+行動”。
它部署在邊緣或設備端;
它能連接傳感器、控制器,能感知、能決策、能執(zhí)行;
它還能嵌入錢包,實現(xiàn)鏈上身份與結算。
AI智能體是一個“能說會道”的大腦,而AIoT智能體,則是一個“能看、能想、能干、還能收錢”的完整勞動力。
不是所有智能體都能進車間、進園區(qū)。要能感知、能執(zhí)行、能結算,才配叫AIoT智能體。

接下來,我們來回答一個非常關鍵的問題:
什么才是真正的AIoT智能體?
很多人以為,只要設備能聯(lián)網,能識別圖像,就可以叫“智能體”了。但實際上,從產業(yè)落地的角度來看,智能體要能真正“干活”,必須具備五種核心能力。
第一種能力:感知。這是最基礎的能力,AIoT智能體必須具備對環(huán)境的持續(xù)感知能力。
第二種能力:推理。感知之后,不是直接行動,而是做出判斷。推理是智能體的邏輯中樞,讓設備開始“思考”。
第三種能力:認知。推理解決的是局部判斷,而認知解決的是整體理解與規(guī)劃。認知,代表了從“理解一個點”到“理解整個任務”的躍遷。
第四種能力:執(zhí)行。理解完了,還要能動手做事。執(zhí)行決定了:智能體是不是一個真正的行動者。
第五種能力:金融結算。這是很多人容易忽略,但未來極其重要的一環(huán)。如果一個設備能完成任務,卻沒有結算能力,它就無法真正參與平臺協(xié)作;金融能力讓智能體擁有自主性,也具備經濟行為能力。
這五種能力構成了AIoT智能體的能力閉環(huán):感知世界,推理判斷,認知任務,執(zhí)行動作,結算價值。

我們將AIoT智能體的發(fā)展,概括為一個“三段論模型”:
階段一:感知體
能采集數(shù)據、上傳信息;
典型形態(tài)是傳統(tǒng)IoT設備:攝像頭、傳感器、PLC控制器;
問題:只能“執(zhí)行”,不能“理解”。
階段二:協(xié)同體
能理解任務、與其他設備協(xié)同;
以邊緣AI+規(guī)則系統(tǒng)為核心;
典型形態(tài)是智能家居系統(tǒng)、園區(qū)自動化系統(tǒng);
問題:固化規(guī)則、缺乏自適應。
階段三:智能體
能感知、理解、推理、行動,并具備自主結算能力;
具備:LLM/SLM+規(guī)劃+調用工具+錢包+反饋;
典型形態(tài)是:自動駕駛智能體、工業(yè)質檢智能體、農業(yè)協(xié)作智能體。
這一演進的核心在于讓設備從“感知世界”到“理解世界”,再到“參與世界”。

這一頁,我們從時間軸的角度,來回顧AIoT智能體的演進路徑。
智能體并不是一蹴而就,憑空產生的,而是經歷了漫長的前期積累。十年感知,五年互聯(lián),走向真正智能。這不是口號,這是我們過去十幾年智能設備演進的真實寫照。
第一階段:感知體普及 從2009年之后,物聯(lián)網概念興起,傳感器開始大規(guī)模部署。 我們稱它為感知體。這是智能體的第一個階段,設備可以感知世界,但不理解、不自主協(xié)作。
第二階段:協(xié)同體部署 從2016年開始,邊緣計算興起,5G網絡落地,大量設備開始“互聯(lián)互通”。 這個階段,我們稱為協(xié)同體。它們之間開始“配合動作”,但智能還來自中心平臺,設備本身還不具備自主性。
第三階段:智能體商業(yè)化 真正的變化發(fā)生在近兩三年:AI讓設備能夠具備語義理解與推理能力;錢包與鏈上結算機制,讓設備擁有身份與價值控制權。 這意味著,設備不再是被動執(zhí)行的終端,而開始成為“能感知、能推理、能決策、能執(zhí)行、還能結算”的主體。 我們稱之為智能體。
所以我們說:十年感知,是設備看到了世界;五年互聯(lián),是設備開始協(xié)同運作;而今天,我們走向真正的智能體時代:自適應、自運行、自結算。

我們來看幾個未來AIoT智能體的應用案例:
1.自動駕駛×充電樁×穩(wěn)定幣
想象你是電動車車主,正穿行在城市中尋找充電樁。導航能告訴你哪里有樁、電價多少、距離多遠,但你仍要自己判斷:這個樁靠不靠譜?會不會被占用?價格是否真實?更不用說,車無法自動決策去哪充、預付多少、何時結算、充完后能否自動離開。
但一切在引入AIoT智能體 + 穩(wěn)定幣支付后發(fā)生了變化:出發(fā)前,車輛就可與充電樁“簽合約”——鏈上鎖定電價、服務等級、時間窗口,并凍結一筆穩(wěn)定幣作為預付款。到站即插即充,充滿后系統(tǒng)自動結算,按實際電量扣費,余額實時返還你錢包,車子無需等待,直接駛離。無需掃碼、無需APP、無需對賬。
信任寫在協(xié)議里,支付嵌在執(zhí)行中。這不是“更智能的支付”,而是“機器之間的經濟協(xié)作”。
2.工業(yè)制造×AIoT智能體×按次付費
以工業(yè)制造為例,一家中小企業(yè)可能無法一次性采購一臺昂貴的激光切割機。但如果設備制造商允許客戶按小時使用,并通過鏈上錢包實時收取費用,客戶只需在需要時喚醒設備,系統(tǒng)根據使用時長自動從其錢包中扣除穩(wěn)定幣。這樣,不僅降低了企業(yè)的使用門檻,也為設備提供商帶來了持續(xù)收入。

正如我曾經提出:“人工智能+”的70%價值來自物聯(lián)網,但真正釋放這70%的潛力,靠的是智能體能動起來,模型能“下沉”。

這兩頁PPT是我們今天的核心內容之一:技術架構:四板塊+雙引擎。
為什么要講這個?
因為很多人談AIoT,還停留在“設備聯(lián)網”或者“智能感知”階段,但我們今天要講的是“能動的智能體”,是可以完成任務、產生價值的智能體。
引擎一:邊緣智能
不只是把模型部署到邊緣,而是讓智能真正“駐扎”在現(xiàn)場;
它能在毫秒級響應、在斷網狀態(tài)下運行、在本地完成決策;
邊緣智能,是讓設備從“被控對象”變成“自治單元”的關鍵。
邊緣智能決定了智能體能不能“獨立思考、就地反應”。
引擎二:垂類模型
通用大模型解決不了行業(yè)問題;
AIoT需要的是針對工業(yè)、電力、安防、農業(yè)等領域的垂直模型;
垂類模型讓智能體具備“專業(yè)知識”和“行業(yè)判斷力”。
垂類模型決定了智能體能不能“聽懂行話、看懂場景”。
邊緣智能讓智能體跑得起來,垂類模型讓智能體干得專業(yè)。兩者疊加才能真正釋放AIoT的價值。

但這也引出一個新的問題:既然模型能夠下沉,未來智能體可以“動起來”——那它到底屬于AI,還是屬于IoT?它是一個“AI模型的終端形態(tài)”,還是一個“IoT設備的進化版本”?
我們發(fā)現(xiàn),AI和物聯(lián)網正在產生越來越大的交集,物聯(lián)網成為了AI落地物理世界的底座。越來越多的設備,正在從“硬件終端”演化成具備智能、目標、自主行為的智能體。
所以,接下來這一頁,我們就來回答這個問題:端側AI和AIoT智能體,到底是什么關系?
它們不是兩條線,而是一條線的兩個階段。
AIoT智能體是端側AI的高級形態(tài)
端側AI提供了算力基礎和模型執(zhí)行能力,而AIoT智能體則將這些能力封裝為具有認知與行動能力的實體,甚至與其他智能體協(xié)同完成復雜任務。
端側AI是AIoT智能體的底層支撐
沒有端側AI的推理與感知能力,AIoT智能體無法實現(xiàn)“在地運行”。

我們將端側AI的四大技術支撐與協(xié)同結構,劃分為四大板塊:芯、模、端、智。
這四個字,既是縮寫,也是路徑。
第一塊:芯
“芯”代表的是整個端側智能的算力基礎。
包括AI芯片、低功耗NPU、SoC、RISC-V架構處理器;
同時也涵蓋邊緣AI加速器、異構計算單元。
可以說,沒有“芯”,就沒有端側智能的“運行力”。
第二塊:模
“?!敝傅氖悄P停绕涫沁m合端側部署的小模型和垂類模型。
包括視覺識別模型、語音識別模型、SLM、TinyML等;
模型的輕量化、專用化,是智能體下沉的關鍵。
我們說,大模型讓AI會說話,小模型讓設備能干活。
第三塊:端
“端”是智能體的物理載體,是它的“身體”。
包括攝像頭、機器人、工業(yè)設備、傳感器、邊緣盒子等;
沒有這些終端設備,AI就無法與現(xiàn)實世界連接。
端,是智能體接觸世界的“著陸點”。
第四塊:智
最后,“智”代表的是智能體本身。
這里包括智能體平臺、調度框架、邊緣智能OS、鏈上身份與結算系統(tǒng);
它是感知、推理、決策、執(zhí)行、結算的調度中樞。
我們不只是要讓設備智能,更要讓它能自主行動、自我協(xié)作、參與經濟活動?!爸恰?,是端側AI的價值閉環(huán)。
“芯”給了智能體算力,“模”給了它思維,“端”給了它身體,而“智”,讓它擁有了行動與經濟能力。
由此,我們繪制了端側AI的產業(yè)圖譜?,F(xiàn)在《中國端側AI全景圖譜》已經正式發(fā)布,歡迎感興趣的朋友掃描下面的二維碼下載報告全文和清晰版圖譜。


掃描二維碼下載報告全文和清晰版圖譜

這一部分是今天演講中我最希望大家記住的觀點:穩(wěn)定幣不僅是Web3的工具,更是AIoT設備的銀行賬戶。

在傳統(tǒng)系統(tǒng)中,設備只能“響應命令”;在AIoT世界中,設備不但要理解任務,還要為服務計價并收款。
我們一起設想這樣的場景:
一臺風力發(fā)電機為鄰近電網供電,誰來結算?
一個果園的土壤傳感器每天上傳數(shù)據,憑什么獲得收益?
一臺激光切割機被“按小時租用”,怎么自動計費?
答案都指向一個關鍵詞:穩(wěn)定幣。

穩(wěn)定幣帶來了三大改變:
1.經濟人格:每個設備擁有錢包地址、預算、財務邊界;2.交易協(xié)議:設備對設備(M2M)即可完成微支付、結算;3.自治能力:無需平臺調度,設備可自主協(xié)作、資源協(xié)商。
穩(wěn)定幣讓設備從連接走向協(xié)作,從行為走向計價,從硬件走向經濟體。

穩(wěn)定幣是連接AIoT設備與價值世界的金融基礎設施,推動物理世界設備實現(xiàn)“可信感知、自動結算、協(xié)作執(zhí)行”的閉環(huán):
1.物理世界的設備(如土地、能源、機械)通過傳感器接入網絡,形成感知層; 2.數(shù)據驅動的設備行為,需要與價值掛鉤,于是引入金融層(穩(wěn)定幣+區(qū)塊鏈); 3.借助智能合約,設備可按規(guī)則自動執(zhí)行服務、調度資源、完成結算; 4.最終,多個設備形成去中心化協(xié)作網絡,構建機器信任與支付閉環(huán)。
穩(wěn)定幣是設備的銀行賬戶,是AIoT系統(tǒng)的經濟協(xié)議,是智能體之間的“價值語言”。

穩(wěn)定幣還將加速重塑物聯(lián)網的商業(yè)模型。
機器經濟的商業(yè)模式正在從一次性“賣設備”,走向持續(xù)性“賣訂閱”,最終升級為“按行為或結果計費”的智能勞動力。
1.賣設備:一次性交付,收入依賴出貨量,價值捕捉有限。 2.賣訂閱:提供持續(xù)服務,建立客戶關系,收入更穩(wěn)、更可預測。 3.賣行為/賣結果:按動作付費、按結果結算,設備變成“可計費的智能勞動力”,嵌入鏈上協(xié)作網絡。
誰能從“賣產品”轉向“賣結果”,誰就能在機器經濟時代掌握價值分配權。

要推動AIoT智能體產業(yè)落地,我們要跳出“軟件即產品”的邏輯,進入“智能體即生態(tài)”的戰(zhàn)略。

智能體不是“一個模型”,而是“平臺×協(xié)議×生態(tài)”的系統(tǒng)性產物,由芯片/模組廠商、平臺方、行業(yè)伙伴共建完成。
芯片/模組廠商:提供算力與部署接口,是智能體的底座;
平臺方:提供垂類模型與智能體操作系統(tǒng),是智能體的大腦與中樞;
ISV/SI廠商:結合場景構建應用智能體,是最終落地者。
智能體不是誰獨立完成的產品,而是芯片、平臺、集成方共同協(xié)作的系統(tǒng)工程。AIoT智能體生態(tài)的價值,不在個體強,而在協(xié)同。

接下來回答一個問題:AIoT智能體應該落地在哪些場景?
AIoT智能體不是無所不能,而是要選對戰(zhàn)場,專注在“高頻率、高價值、強閉環(huán)”的任務中,才能真正落地并創(chuàng)造價值。
1.高頻率:場景重復、數(shù)據密集,智能體有學習空間,才“值得訓練”。2.高價值:每個動作能帶來效率、成本或質量的改善,才“值得執(zhí)行”。3.閉環(huán)性:能識別問題,也能執(zhí)行反饋,形成閉環(huán),才“真正落地”。
高頻確?!澳茏觥保邇r值保證“值得做”,閉環(huán)決定“做得成”。
寫在最后

當然,今天我們所討論的,只是AIoT智能體、場景智能、垂類模型等廣闊圖景中的一角。作為一個仍在快速演化的新生事物,AIoT智能體的技術邊界、應用路徑與商業(yè)模式,還有許多值得深入思考與持續(xù)驗證的地方。
無論是模型如何更高效地下沉終端,還是AIoT智能體如何在多智能體系統(tǒng)中有效協(xié)作,亦或是機器經濟如何在真實環(huán)境中閉環(huán)運行,這些問題都沒有標準答案。我們正處在一個充滿可能性的起點。
未來的探索,不可能依靠某一家企業(yè)、某一個技術體系獨自完成,而需要整個生態(tài)共同努力。也誠摯期待在后續(xù)的實踐中,與各位產業(yè)同行、研究者、開發(fā)者一起,持續(xù)碰撞、驗證、打磨,尋找屬于AIoT智能體的真正落點。
更歡迎大家在后續(xù)的交流活動中,與我深入探討、共同探索答案。
最后,我想用三句話做結尾:
1.通用大模型是AI的高原,智能體才是產業(yè)的金礦。
2.智能體不是模型,是工具+協(xié)議+經濟行為的復合體。
3.未來的AI,不是更聰明,而是更能干、能協(xié)作、能收錢。