Anthropic在2025年6月16日發布的技術博客中,詳細披露了其Claude AI多智能體研究系統的構建歷程。該系統采用“主導智能體(LeadResearcher)+子智能體(Subagents)”架構,在處理開放性研究任務時展現出顯著優勢。內部評測顯示,以Claude Opus 4為主智能體、Claude Sonnet 4為子智能體的組合,性能較單智能體提升??90.2%??。
??動態并行處理突破單智能體極限??
傳統檢索增強生成(RAG)依賴靜態檢索,而Anthropic的解決方案通過多步驟動態搜索實現突破。主導智能體將用戶查詢拆解為子任務后,??同時激活3-5個子智能體??,每個子智能體可并行調用3個以上工具。這種設計使復雜查詢的研究時間縮短90%,例如在檢索“信息技術S&P 500企業董事會成員”時,多智能體系統成功完成任務,而單智能體因串行檢索失敗。
核心優勢源于??token的高效利用??。在BrowseComp評估中,token消耗量單獨解釋80%的性能差異。升級至Claude Sonnet 4帶來的效率提升,甚至超過將Claude Sonnet 3.7的token預算翻倍。但代價是顯著增加的資源消耗——多智能體系統的token使用量達普通聊天的15倍,單智能體則為4倍。
??提示詞工程解決協同難題??
早期版本曾出現“為簡單查詢生成50個子智能體”的失控情況。Anthropic通過精細化提示詞設計建立控制機制:
- ??分級投入規則??:簡單查詢分配1個智能體(3-10次工具調用),復雜任務啟用10+子智能體
- ??工具選擇啟發式??:強制智能體先掃描所有可用工具,專業任務優先選用專用工具
- ??擴展思維模式??:讓Claude展示思考過程,主導智能體借此規劃策略
“我們曾允許主導智能體發出‘研究芯片短缺’這類模糊指令,結果三個子智能體重復檢索2025年供應鏈數據,報告重復率達60%。”團隊通過引入??明確的任務邊界描述??解決了這一問題。
??生產環境挑戰與解決方案??
智能體系統的狀態持續性帶來獨特工程難題:
- ??錯誤累積??:采用檢查點恢復機制,結合Claude的自主調整能力處理工具故障
- ??調試困難??:部署全量生產追蹤系統監控決策模式
- ??版本管理??:使用彩虹部署逐步遷移流量,避免中斷運行中的智能體
當前同步執行架構存在瓶頸,主導智能體需等待子智能體全部完成。Anthropic透露正在開發異步方案,但需平衡??并行性與錯誤傳播風險??。
該技術已應用于實際場景,用戶反饋稱其能“發現商業機會”“厘清醫療方案”。Anthropic強調,成功部署需??研究、產品與工程團隊的深度協作??,以及對智能體能力閾值的準確認知。隨著AI進入協同智能階段,多智能體系統正成為解決開放性問題的關鍵基礎設施。