久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

斯坦福MIT聯(lián)合推出ReCAP:攻克長上下文難題,性能顯著超越ReAct

   時間:2025-12-05 17:11 來源:快訊作者:鐘景軒

斯坦福大學(xué)與麻省理工學(xué)院(MIT)聯(lián)合研究團隊近日宣布,推出一種名為ReCAP的新型AI推理框架,在長上下文任務(wù)中展現(xiàn)出顯著優(yōu)勢,全面超越當(dāng)前主流的ReAct框架。這一突破性成果標(biāo)志著AI智能體推理領(lǐng)域迎來新一代通用架構(gòu),為解決大語言模型在復(fù)雜任務(wù)中的核心挑戰(zhàn)提供了創(chuàng)新方案。

自2022年ReAct框架問世以來,AI推理領(lǐng)域涌現(xiàn)出眾多復(fù)雜架構(gòu),但多數(shù)因結(jié)構(gòu)冗余導(dǎo)致泛化能力不足。研究團隊指出,現(xiàn)有框架在處理長序列任務(wù)時普遍存在三大瓶頸:目標(biāo)漂移(執(zhí)行過程中偏離初始目標(biāo))、上下文斷層(高層規(guī)劃與底層執(zhí)行脫節(jié))以及成本爆炸(遞歸推理導(dǎo)致計算資源指數(shù)級增長)。這些問題使得ReAct成為過去三年中最穩(wěn)定、通用的基準(zhǔn)框架。

ReCAP通過遞歸樹結(jié)構(gòu)與三大核心機制,首次實現(xiàn)了序列推理與層級推理的有機統(tǒng)一。其"計劃前瞻分解"機制允許模型生成完整子任務(wù)列表后動態(tài)優(yōu)化后續(xù)計劃;"結(jié)構(gòu)化父任務(wù)再注入"機制確保所有任務(wù)共享單一上下文,通過父任務(wù)思維回溯保持目標(biāo)一致性;"滑動窗口記憶"機制則通過關(guān)鍵歷史保留機制控制內(nèi)存占用,從根本上避免成本失控。研究負責(zé)人表示:"這種設(shè)計讓模型既具備全局視野,又能聚焦當(dāng)前步驟,類似人類在復(fù)雜任務(wù)中'邊規(guī)劃邊調(diào)整'的思維方式。"

在嚴(yán)格遵循pass@1評測標(biāo)準(zhǔn)(不使用重試或投票機制)的實驗中,ReCAP在多項基準(zhǔn)測試中取得突破性進展:在長序列具身任務(wù)Robotouille(同步模式)中成功率達70%,較ReAct提升84.2%;異步模式下成功率53%,提升112.5%;在代碼編輯任務(wù)SWE-bench Verified中成功率44.8%,優(yōu)于ReAct基線5.2個百分點。更關(guān)鍵的是,這種性能提升不依賴樣本層面的優(yōu)化,展現(xiàn)了真正的執(zhí)行穩(wěn)定性。

技術(shù)突破背后是計算成本的權(quán)衡。實驗數(shù)據(jù)顯示,ReCAP的總計算量約為ReAct的三倍,主要源于計劃前瞻分解機制帶來的額外模型調(diào)用。但研究團隊強調(diào),在醫(yī)療診斷、自動駕駛等對準(zhǔn)確性要求極高的場景中,這種成本增加完全可接受。麻省理工學(xué)院Alex Pentland教授指出:"當(dāng)性能提升幅度超過成本增速時,這就不是簡單的技術(shù)迭代,而是范式轉(zhuǎn)移的開始。"

該框架的潛力已延伸至具身智能與空間智能的交叉領(lǐng)域。研究演示中,ReCAP成功規(guī)劃了機器人完成多步驟廚房任務(wù),其遞歸規(guī)劃能力與空間感知模型形成互補——前者負責(zé)長期目標(biāo)分解,后者處理實時環(huán)境交互。這種協(xié)同模式為自主機器人、復(fù)雜系統(tǒng)維護等應(yīng)用開辟了新路徑。斯坦福博士后研究員Jiaxin Pei透露,團隊正在探索將ReCAP與多模態(tài)大模型結(jié)合,使其能處理包含圖像、文本、傳感器數(shù)據(jù)的混合輸入。

目前,ReCAP的代碼已開源,其模塊化設(shè)計允許開發(fā)者根據(jù)需求調(diào)整遞歸深度與記憶窗口大小。這項研究不僅為AI推理提供了新基準(zhǔn),更揭示了遞歸結(jié)構(gòu)在通用智能中的核心價值。正如論文所論:"從圖靈機到人類認知,遞歸始終是處理復(fù)雜性的基礎(chǔ)邏輯。ReCAP的實踐表明,這種邏輯可以通過工程化手段轉(zhuǎn)化為可計算的智能形態(tài)。"

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容