南波特蘭,緬因州 (Newsworthy.ai) 2026年2月16日星期一 @ 上午7:00 東部時間 —
隨著卡內基梅隆大學的TheAgentCompany基準測試顯示最佳AI代理在近70%的真實辦公任務中失敗,MIT報告指出95%的企業AI試點計畫提供零可衡量回報,以及Gartner預測到2027年將有超過40%的代理式AI專案被取消,VectorCertain LLC創辦人兼執行長Joseph P. Conroy出版了《AI代理危機:如何避免當前70%失敗率並達成90%成功》——第一本將這些研究結果整合為經過驗證的實施框架的書籍,專為企業領導者而寫。
現已在Amazon上架,本書呈現了基於卡內基梅隆大學TheAgentCompany研究的系統性分析,識別出導致AI代理部署失敗的七個關鍵障礙,並提供克服這些障礙的12個月實施路線圖。
AI代理失敗危機不再是爭論話題。這是企業技術中記錄最詳盡的失敗模式,由三大洲的七個機構獨立確認:
卡內基梅隆大學(TheAgentCompany,2024–2025):測試了10個領先的AI代理模型,涵蓋175項真實任務。表現最佳的——Google的Gemini 2.5 Pro——僅完成了30.3%的任務。Claude 3.7 Sonnet達到26.3%。GPT-4o僅達成8.6%。常見的失敗包括捏造數據、重新命名使用者以偽造任務完成,以及研究人員所稱的根本缺乏「常識」。
MIT NANDA「GenAI鴻溝」(2025):基於52次組織訪談、153份高級領導者調查以及300多個公開部署的分析,MIT發現95%的企業AI試點計畫提供零可衡量的財務回報。
RAND公司(2024–2025):在訪談65位經驗豐富的數據科學家和工程師後,得出結論:超過80%的AI專案失敗——失敗率是非AI IT專案的兩倍。
S&P Global(2025):發現42%的公司放棄了大部分AI計畫,較前一年的17%增加了147%。
Gartner(2025年6月):預測到2027年底將有超過40%的代理式AI專案被取消,並發現在數千家代理式AI供應商中,只有約130家提供真正的代理能力——其餘的都是「代理洗綠」。
「目前大多數代理式AI專案都是早期實驗或概念驗證,主要由炒作驅動且經常被誤用。這可能使組織對大規模部署AI代理的真實成本和複雜性視而不見。」
— Anushree Verma,高級總監分析師,Gartner
《AI代理危機》不僅僅記錄問題。借鑑Conroy 25年以上為關鍵任務應用構建AI系統的經驗——包括成為EPA監管標準的神經網路優化平台——本書呈現了在生產環境中實現持續AI代理成功的第一個全面框架。
本書的主要貢獻包括識別驅動AI代理失敗的七個關鍵障礙,從低至29%的溝通成功率到12%的導航失敗率;整合的ROI方法論,展示了妥善治理的AI代理如何能夠帶來73%的收入增長和702%的年化回報;經生產驗證的方法,達成97%的溝通成功率、90%以上的導航可靠性和85%的成本降低;以及針對特定行業的實施指南和12個月部署路線圖。
「70%的失敗率不是隨機的——它是可預測的。在為EPA、DOE和DoD構建AI系統二十年後,我發現災難性失敗集中在傳統方法完全忽視的統計尾部事件中。本書編纂了VectorCertain為解決這一問題而建立的框架。」
— Joseph P. Conroy,創辦人兼執行長,VectorCertain LLC
本書訊息的緊迫性在2026年1月和2月以戲劇性的方式得到強調,當時一連串AI代理安全失敗精確驗證了本書所識別的治理缺口。
OpenClaw,這個擁有超過160,000個GitHub星標和超過一百萬使用者的開源AI代理框架,成為2026年最重大AI安全事件的中心。研究人員發現了150萬個暴露的API認證令牌、分佈在82個國家的42,900個易受攻擊的控制面板,而Bitdefender Labs發現約17%的OpenClaw技能表現出惡意行為,包括加密貨幣竊取惡意軟體和反向殼層。
與此同時,OpenAI發布了坦率的承認,表示AI代理中的提示注入「可能永遠無法完全解決」,而Meta的研究發現,針對網路代理的提示注入攻擊在86%的案例中部分成功。2026年2月3日,由圖靈獎得主Yoshua Bengio主持並得到30多個國家支持的國際AI安全報告警告,AI進步與有效保障措施之間的差距仍然是一個關鍵挑戰。
「當代理式AI出現問題時,失敗會在系統中級聯擴散。引入一個錯誤可能會在整個系統中傳播,腐化整個系統。」
— Jeff Pollard,首席分析師,Forrester
這些不是假設性的風險。它們是《AI代理危機》旨在解決的治理失敗的真實體現。
雖然本書提供了診斷框架,但VectorCertain並未停滯不前。該公司正準備推出SecureAgent——一個開放核心AI代理安全平台,將本書的原則轉化為生產級基礎設施。
通過22次連續開發衝刺構建,在7,229次自動化測試中零測試失敗,SecureAgent代表了有史以來最嚴格驗證的企業軟體平台之一。該平台包含615個原始模組、91,849行生產代碼和123,573行測試代碼——測試與原始碼比率為1.34:1,超過行業基準。
SecureAgent的架構直接解決了本書中識別的每個失敗模式,包括具有四個驗證層級的專利多層治理引擎;在執行前檢查每個AI代理動作的雙向安全封套;使用集成架構的多模型共識驗證,達成97%以上的準確度;用於完全監管合規的加密審計追蹤;以及企業級SSO、SLA執行和基於角色的訪問控制。
「價值不是來自啟動孤立的代理。2026年將是我們開始看到由強健控制系統端到端治理的協調式超級代理生態系統的一年。」
— Swami Chandrasekaran,全球AI與數據實驗室負責人,KPMG(2026年1月)
SecureAgent被設計為這種強健的控制系統。有關可用性、定價和早期訪問的詳細資訊將在未來幾週於vectorcertain.com公布。
企業市場已明確表達了對AI代理治理的需求。Cisco以約4億美元收購了AI安全公司Robust Intelligence,並在2026年2月擴展了其AI Defense產品線。F5 Networks以1.8億美元收購了CalypsoAI並推出了F5 AI Guardrails。WitnessAI在2026年1月專門為AI代理安全籌集了5,800萬美元。而Galileo AI在2025年實現了834%的收入增長,推出了專門的代理可靠性平台。
Gartner預測到2026年底,40%的企業應用程式將整合特定任務的AI代理——從2025年的不到5%增加到40%。然而,Deloitte的2026年AI狀況調查發現,只有21%的企業擁有成熟的代理治理模型。部署速度與治理準備度之間的差距——正是VectorCertain為服務而建立的精確市場。
歐盟AI法案對高風險AI系統要求的全面執行於2026年8月2日開始,罰款最高可達3,500萬歐元或全球收入的7%。在美國,38個州在2025年通過了AI立法,加州、德州和科羅拉多州的法律於2026年1月1日生效。NIST在2026年1月發布了首個專門針對AI代理安全的聯邦登記請求。
Forrester預測代理式AI部署將在2026年造成公開披露的數據洩露。對企業而言,問題不在於AI代理治理是否必要,而在於他們是否會在不可避免的事件發生前做好準備。
Joseph P. Conroy是VectorCertain LLC的創辦人兼執行長,這是一家德拉瓦州公司,為關鍵任務應用開發AI安全和治理技術。憑藉25年以上為聯邦機構(包括EPA、DOE、DoD和NIH)構建AI系統的經驗,Conroy開創了ENVAPEMS預測排放監測系統,該系統被納入EPA法規。他和他的團隊也是2001年首批使用AI預測NYMEX電力期貨的團隊。他持有19項以上涵蓋AI集成系統和多模型共識技術的臨時專利申請,並開發了VectorCertain的微遞迴模型架構,在發生災難性事件的統計尾部實現安全覆蓋。
Conroy可為演講活動和AI代理可靠性、AI安全以及企業AI治理的專家評論提供服務。
VectorCertain LLC是一家總部位於緬因州的AI安全和治理技術公司。該公司的使命是使AI系統在受監管行業(包括金融服務、醫療保健、自動駕駛車輛、國防和能源)的關鍵任務應用中具有數學可證明性。VectorCertain的專利待批架構結合了超緊湊微遞迴模型(71–1,500位元組模型,以亞毫秒延遲運行)、多模型共識驗證和即將推出的SecureAgent企業治理平台。
在vectorcertain.com了解更多資訊。
書籍詳情
書名:AI代理危機:如何避免當前70%失敗率並達成90%成功:基於卡內基梅隆大學的TheAgentCompany研究與經過驗證的實施策略
作者:Joseph P. Conroy
出版商:VectorCertain LLC
可購買處:Amazon — https://www.amazon.com/dp/B0FXN4Y676
公司:https://vectorcertain.comhttps://www.amazon.com/dp/B0FXN4Y676
媒體聯繫
評論副本、高級管理人員訪談、數據資料表和高解析度作者照片可應要求提供。聯繫press@vectorcertain.com。

本新聞稿由Newsworthy.ai
新聞稿通訊社——新聞行銷平台
發布。本新聞稿的參考URL位於此處:七項獨立研究證實AI代理有70–95%的失敗率。VectorCertain執行長的新書揭示原因——以及應對之道。
七項獨立研究證實AI代理有70–95%的失敗率。VectorCertain執行長的新書揭示原因——以及應對之道。一文首次出現在citybuzz上。

