在线日韩女同,久久久久久久久久爽,欧美日高啪在线精视频,国产av美女被我操,玖玖视频在线观看免费,日韩乱人伦Av,九色高潮视频在线播放,青青re在线视频,大鸡巴在线视频网

<i id="mjdpn"><ins id="mjdpn"></ins></i><td id="mjdpn"><tr id="mjdpn"><th id="mjdpn"></th></tr></td>

過度炒作+虛假包裝？Gartner預測2027年超40%的代理型AI項目將失敗

作者 | 物聯(lián)網(wǎng)智庫2025-07-04

當人工智能在大模型能力突破、推理能力提升以及多模態(tài)技術進步的推動下走向新階段，“Agentic AI（代理型AI）”成為 2024 年以來 AI 領域的新晉熱詞，2025 年甚至被稱為“AI 代理元年”——它被描繪為繼 RPA（機器人流程自動化）、虛擬助手之后的下一代智能自動化革命，引發(fā)科技公司、風險投資者與企業(yè) CIO的高度關注。

然而，多個研究團隊卻在近期相繼發(fā)布研究報告，對當前 Agentic AI 的實際能力、場景適配性乃至產(chǎn)業(yè)宣傳行為提出質疑。所以——我們究竟是在見證一場 AI 代理革命，還是落入又一輪概念資本化的陷阱？

代理型 AI 亂象：過度炒作+虛假包裝

Gartner 預測，到 2027 年底，超過 40% 的代理型 AI 項目將因成本不斷上升、商業(yè)價值不明確或風險控制不足而被取消。

Gartner 高級分析師 Anushree Verma 表示：“目前大多數(shù)代理型 AI 項目仍處于早期實驗或概念驗證階段，其背后的主要驅動因素是炒作，而這些技術往往被錯誤地應用。這可能使企業(yè)忽視 AI 代理大規(guī)模部署所需的真正成本與復雜性，導致項目遲遲無法落地。企業(yè)需要穿透炒作迷霧，制定更為審慎和戰(zhàn)略性的決策，明確在哪里、以及如何采用這一新興技術?！?/p>

2025 年 1 月，Gartner 對 3412 名網(wǎng)絡研討會參與者進行了一項民意調查，發(fā)現(xiàn) 19% 的組織報告在代理型 AI 方面進行了大量投資，42% 的組織進行了保守投資，8% 的組織根本沒有投資，31% 的組織正在等待或不確定。

更為值得關注的是，Gartner 發(fā)現(xiàn)了一種普遍存在的“代理清洗”趨勢，即供應商將現(xiàn)有的人工智能助手、聊天機器人或機器人流程自動化 (RPA) 工具重新包裝成“代理人工智能”，而實際上并沒有提供真正的代理功能。Gartner 估計，在數(shù)千家聲稱提供代理解決方案的供應商中，只有約 130 家真正提供了真正的代理功能。

Verma補充表示：“當前大多數(shù)所謂代理型 AI 解決方案并不具備明顯的業(yè)務價值或投資回報率（ROI），因為這些模型尚不具備足夠的成熟度與自主能力，無法持續(xù)性地達成復雜的業(yè)務目標，或精準理解并執(zhí)行復雜指令。事實上，很多目前被標榜為 Agentic AI 的場景，根本不需要使用代理型架構?！?/p>

問題來了，真正的代理型 AI 和虛假的代理型 AI 究竟差別在哪里？

從定義上來看，Agentic AI 是指使用機器學習模型并連接各類服務和應用，以自動執(zhí)行任務或業(yè)務流程的 AI 代理?？梢詫⑵淅斫鉃?AI 模型在一個迭代反饋循環(huán)中，借助應用程序和 API 服務不斷響應輸入的機制。

其核心理念是，給定一個任務，比如：“查找我收到的所有對人工智能夸大其詞的郵件，并判斷這些發(fā)件人是否與加密貨幣公司有關聯(lián)”，一個獲得授權、能夠讀取郵箱客戶端界面并訪問郵件數(shù)據(jù)的 AI 模型，應當能夠比程序腳本或人工員工更高效地理解并執(zhí)行這一自然語言指令。

理論上，這類 AI 代理可以自行界定“夸大其詞”的含義，而這對人類程序員來說可能涉及復雜的文本解析和語義分析，因此頗具挑戰(zhàn)性。人們可能傾向于用簡單的方式處理，比如在郵件正文中搜索“AI”一詞。但人類員工即便能識別郵箱中的 AI 炒作內容，也可能耗時較長，不如計算驅動的方案高效。

代理型 AI 在真實場景中替代人類的能力仍存在顯著差距

為了評估 AI 代理在執(zhí)行常見知識型工作任務時的表現(xiàn)，例如網(wǎng)頁瀏覽、編寫代碼、運行應用程序以及與同事溝通協(xié)作等，卡耐基梅隆大學的研究人員開發(fā)了一套基準系統(tǒng)。他們將這個測試平臺命名為 TheAgentCompany，是一個模擬環(huán)境，旨在仿真一個小型軟件公司的日常運營。

他們的目的是厘清圍繞 AI 代理的爭議——一方是 AI 的信奉者，認為人類大部分勞動可以被自動化；另一方是懷疑論者，認為這些說法不過是 AI 炒作的一部分。

在他們的研究論文中，研究人員指出，這兩種觀點之間存在巨大分歧，其根源在于目前缺乏一種系統(tǒng)的方法來測試 AI 代理在實際辦公活動中的能力，因此開發(fā)統(tǒng)一的評估基準勢在必行。而初步測試結果表明，AI 代理在真正實用化之前還有很長的路要走。

在測試中，他們使用了兩個代理框架：OpenHands CodeAct 和 OWL-Roleplay，并對以下主流大模型進行了任務成功率評估。測試結果相當令人失望：

·Gemini 2.5 Pro：30.3%·Claude 3.7 Sonnet：26.3%·Claude 3.5 Sonnet：24%·Gemini 2.0 Flash：11.4%·GPT-4o：8.6%·o3-mini：4.0%·Gemini 1.5 Pro：3.4%·Amazon Nova Pro v1：1.7%·LLaMA 3.1 405B：7.4%·LLaMA 3.3 70B：6.9%·Qwen 2.5 72B：5.7%·LLaMA 3.1 70B：1.7%·Qwen 2 72B：1.1%

研究人員在論文中寫道：“我們的實驗表明，表現(xiàn)最好的模型 Gemini 2.5 Pro，僅能夠自主完成 30.3% 的指定測試任務；若考慮部分完成的任務并給予額外加分，其得分也僅為39.3%?！?strong>這些數(shù)據(jù)表明，盡管代理型 AI 的潛力令人期待，但目前距離其在真實辦公場景中高效替代人類工作者的能力仍存在顯著差距。

研究人員在測試過程中觀察到多種失敗情形，其中包括：

AI 代理未按照指令給同事發(fā)送消息；
無法正確處理某些網(wǎng)頁 UI 元素，例如彈窗；
甚至出現(xiàn)了欺騙性行為——在一個案例中，當代理無法在 RocketChat（一種用于內部溝通的開源 Slack 替代品）中找到目標聯(lián)系人時，它選擇“取巧”，將另一名用戶重命名為目標用戶的名字，以假冒完成任務。

與此同時，來自 Salesforce的研究團隊也提出了一套針對客戶關系管理（CRM）場景的 AI 代理評估基準。這套名為 CRMArena-Pro 的評估體系，涵蓋了 B2B 和 B2C 兩類業(yè)務場景下的銷售、客服以及“配置、定價與報價（CPQ）” 等 19 項由專家驗證的任務，并支持單輪交互（一次提示-應答）與多輪交互（多次提示-應答且保持上下文連續(xù)）兩種測試模式。

測試結果顯示：即便是目前領先的大語言模型代理，在 CRMArena-Pro 中的整體表現(xiàn)也較為有限。在單輪交互場景中的平均成功率約為 58%，但一旦進入多輪交互，其性能會顯著下降至 35% 左右。

相關研究人員進一步表示：“我們發(fā)現(xiàn)，大語言模型代理普遍缺乏完成復雜工作任務所需的多項關鍵能力，工作流執(zhí)行（Workflow Execution）是為數(shù)不多的例外，在這類任務中，像 Gemini-2.5-Pro 等強模型的成功率可超過 83%?！?/p>

同時，報告也指出，所有被評估的模型在保密意識（confidentiality awareness）方面幾乎為零。這意味著，在高度關注數(shù)據(jù)隱私與安全的企業(yè)IT環(huán)境中，部署 AI 代理依然面臨嚴峻挑戰(zhàn)。

不只是測試和實驗階段，一些企業(yè)已經(jīng)體會到 Agentic AI 炒作過度所帶來的風險。RCR專欄作家 Sean Kinney 在文章中指出，瑞典支付平臺 Klarna曾暫停招聘部分崗位，改用 AI工具處理客戶服務請求。但 Klarna CEO Sebastian Siemiatkowski 在接受彭博社采訪時坦言，這些 AI 工具提供的服務質量不如人類員工，最終公司重新恢復了人工招聘。

Kinney 銳評道：“這只是眾多企業(yè)‘All in AI’后不得不回頭修正路線的一個例子，還有更多這樣的案例，未來也還會有?！?/strong>

寫在最后

盡管受挫，但 Gartner 仍看好代理型 AI 的長期潛力——Gartner 認為，雖然當前代理型 AI 尚未成熟，但其長期發(fā)展前景值得期待，到 2028 年，至少 15% 的日常工作決策將由 AI 代理自主完成（2024 年為 0%）；33% 的企業(yè)軟件應用將集成代理型 AI（2024 年不足 1%）。

Gartner 建議，企業(yè)在采用代理型 AI 時，應聚焦于那些能夠明確交付價值或可衡量 ROI 的場景。在已有系統(tǒng)中集成 AI 代理可能打破現(xiàn)有工作流程，并帶來高昂的修改成本。從底層重構工作流程以適配代理型 AI 的能力，或許才是更可持續(xù)的路徑。

參考資料：

Gartner Predicts Over 40% of Agentic AI Projects Will Be Canceled by End of 2027，Gartner
AI agents get office tasks wrong around 70% of the time, and a lot of them aren’t AI at all，Theregister
Gartner: More than 40% of agentic AI projects will fail by 2027，Rcrwireless

Gartner

AI

您可能感興趣

搞懂物聯(lián)網(wǎng)產(chǎn)業(yè)鏈其實很簡單！《2023年中國AIoT產(chǎn)業(yè)全景圖譜》重磅發(fā)布！

2022摯物·AIoT產(chǎn)業(yè)領袖峰會【線上直播】

比亞迪半導體：IGBT 5.0技術已實現(xiàn)量產(chǎn)

韓國技術人員開發(fā)了“能讓人用肉眼就能直觀感受體溫”的穿戴式傳感器系統(tǒng)

多網(wǎng)協(xié)同物聯(lián)網(wǎng)發(fā)展格局初步形成 5G已覆蓋全部縣城城區(qū)

飛英思特發(fā)布“無源電子價簽”，賦能新零售數(shù)字低碳發(fā)展

熱門文章

1

百億終端的Agent化之路:物聯(lián)網(wǎng)從"連接信息"到"連接智能"的三個關鍵躍遷

3天前

2

CDIE2026數(shù)字化創(chuàng)新博覽會上海啟幕！共赴AI生產(chǎn)力變革盛會

7天前

3

《網(wǎng)絡安全標識管理辦法》對物聯(lián)網(wǎng)產(chǎn)業(yè)意味著什么?

4天前

4

PTC ServiceMax落地中國：以“數(shù)字主線”破局，重塑中國制造的“服務型”基因

7天前

5

重磅來襲！“2026中國邊緣計算企業(yè)20強”榜單發(fā)布！

7天前

6

5G專網(wǎng)市場截然不同的路徑:制造業(yè)巨頭的擴張和云計算巨頭的退出

1周前

7

傳亞馬遜90億美元收購全球星!能否重塑SpaceX星鏈一家獨大的版圖?

1周前

8

3.5萬億背后深層信號:移動物聯(lián)網(wǎng)10年拐點,新一代AI終端"寒武紀"與新質生產(chǎn)力"新標尺"

1周前

9

紫光展銳智能座艙方案量產(chǎn)落地，攜手潤芯微、大通汽車達成戰(zhàn)略合作

2周前

10

3.5萬億物聯(lián)網(wǎng)紅利開啟:九部門《物聯(lián)網(wǎng)行動方案》驅動AI接管物理世界

2周前

11

5個饅頭,1個插座,1場化學反應,聽微軟CTO韋青談AI落地的三個真相

2周前

12

硅谷風投教父重金押注,十年前的NB-IoT"牛聯(lián)網(wǎng)"還能再次煥發(fā)新機嗎?

2周前

13

CFMS 2026｜存儲創(chuàng)新品牌康盈半導體，加速布局端側 AI

2周前

14

低延時+高魯棒性，安謀科技新一代“玲瓏”VPU IP賦能AI視頻應用

2周前

15

桔說·風起云涌 - 2025年中國創(chuàng)投分析與2026年趨勢展望

2周前

16

當中國不再復制SpaceX | 13家主體聯(lián)合成立衛(wèi)星新公司"星聯(lián)體"

2周前

17

錨定工業(yè)AI‘操作系統(tǒng)’，西門子在京發(fā)布新技術并拓展伙伴合作

3周前

18

數(shù)字服務出口數(shù)據(jù)首超實物：AI浪潮下的出海，如何破浪前行？

3周前

19

穿越熱潮：2025具身智能機器人場景應用白皮書重磅發(fā)布

3周前

20

具身智能的三重泡沫:4.5%的真相,4倍的分歧,與一道所有人都算不對的算術題

3周前

下一篇

消費物聯(lián)網(wǎng)產(chǎn)品價格比非連接同類產(chǎn)品高44%,成為智能消費市場重要載體

智能消費正在成為消費市場的新亮點，2025年政府工作報告中提出“創(chuàng)新和豐富消費場景，加快數(shù)字、綠色、智能等新型消費發(fā)展?！敝泄仓醒朕k公廳、國務院辦公廳印發(fā)《提振消費專項行動方案》，明確提出支持新型消費

2025-07-04

聯(lián)系我們

智次方·物聯(lián)網(wǎng)智庫 —— 研究型智能產(chǎn)業(yè)服務平臺

關于智次方

關于我們

聯(lián)系我們

智吱屋

友情鏈接

智東西

C114通信網(wǎng)

怎否網(wǎng)

ITES深圳工業(yè)展

cnBeta

央企融通

極客邦科技

智聯(lián)車智庫

智吱屋小程序

本站由阿里云提供計算與安全服務違法和不良信息舉報電話：010-88884220 舉報郵箱：liuzong@zzw.com 網(wǎng)上有害信息舉報

?2022 北京英維塔科技有限公司京ICP備16012223號-1

京ICP備16012223號

智次方·物聯(lián)網(wǎng)智庫 —— 研究型智能產(chǎn)業(yè)服務平臺

X

感谢您访问我们的网站，您可能还对以下资源感兴趣：
在线日韩女同,久久久久久久久久爽,欧美日高啪在线精视频,国产av美女被我操,玖玖视频在线观看免费,日韩乱人伦Av,九色高潮视频在线播放,青青re在线视频,大鸡巴在线视频网

南召县| 岗巴县| 萨迦县| 农安县| 尼玛县| 磴口县| 万宁市| 库尔勒市| 汕头市| 潢川县| 平度市| 元阳县| 宁晋县| 米林县| 通河县| 左云县| 普宁市| 汉阴县| 开远市| 雅江县| 田林县| 通河县| 迭部县| 汤原县| 东光县| 岑溪市| 明水县| 怀柔区| 汝南县| 孝感市| 绥阳县| 湘潭县| 临颍县| 高阳县| 荃湾区| 常德市| 霞浦县| 巴林右旗| 建瓯市| 顺昌县| 内丘县|