久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來(lái)市場(chǎng)!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評(píng)論 旗下
洞察商業(yè) 啟迪未來(lái)

上交團(tuán)隊(duì)攜ML-Master 2.0登頂OpenAI基準(zhǔn)測(cè)試,國(guó)產(chǎn)AI引領(lǐng)科研新范式

   時(shí)間:2025-12-25 17:49 來(lái)源:快訊作者:顧雨柔

在人工智能與科研深度融合的浪潮中,一款名為ML-Master 2.0的自主智能體系統(tǒng)引發(fā)全球關(guān)注。由上海交通大學(xué)人工智能學(xué)院、上海算法創(chuàng)新研究院及深勢(shì)科技聯(lián)合研發(fā)的這款系統(tǒng),基于國(guó)產(chǎn)開源大模型DeepSeek-V3.2-Speciale,在OpenAI權(quán)威評(píng)測(cè)基準(zhǔn)MLE-bench中以56.44%的獎(jiǎng)牌率登頂全球榜首,較國(guó)際頂尖團(tuán)隊(duì)基于閉源模型的方案提升28.3%。這一突破標(biāo)志著中國(guó)團(tuán)隊(duì)在AI驅(qū)動(dòng)科研探索領(lǐng)域?qū)崿F(xiàn)關(guān)鍵范式革新。

區(qū)別于傳統(tǒng)AI系統(tǒng)聚焦短程任務(wù)優(yōu)化的路徑,ML-Master 2.0專為機(jī)器學(xué)習(xí)工程(MLE)的復(fù)雜場(chǎng)景設(shè)計(jì)。真實(shí)科研場(chǎng)景中,科研人員常需在數(shù)十小時(shí)內(nèi)經(jīng)歷假設(shè)驗(yàn)證、代碼調(diào)試、結(jié)果分析的循環(huán)迭代,失敗率遠(yuǎn)高于成功率。研發(fā)團(tuán)隊(duì)突破性地將"認(rèn)知積累"作為核心架構(gòu),通過(guò)層次化認(rèn)知緩存機(jī)制(HCC),將探索過(guò)程中產(chǎn)生的經(jīng)驗(yàn)、知識(shí)與智慧分層管理:即時(shí)經(jīng)驗(yàn)支撐當(dāng)前決策,穩(wěn)定知識(shí)服務(wù)同一任務(wù),跨任務(wù)智慧為新問(wèn)題提供策略起點(diǎn)。這種設(shè)計(jì)使系統(tǒng)在長(zhǎng)時(shí)間運(yùn)行中既能保持探索方向,又能避免"上下文爆炸"導(dǎo)致的認(rèn)知混亂。

在MLE-bench的嚴(yán)苛測(cè)試中,ML-Master 2.0展現(xiàn)三大核心能力:其一,超長(zhǎng)程自主性,可在持續(xù)數(shù)十小時(shí)的科研任務(wù)中保持目標(biāo)聚焦;其二,高效試錯(cuò)機(jī)制,能從失敗實(shí)驗(yàn)中提煉規(guī)律而非簡(jiǎn)單重復(fù)嘗試;其三,認(rèn)知遷移能力,能將已驗(yàn)證無(wú)效的技術(shù)路徑主動(dòng)排除,并將經(jīng)驗(yàn)轉(zhuǎn)化為可復(fù)用的認(rèn)知資產(chǎn)。測(cè)試數(shù)據(jù)顯示,該系統(tǒng)在完全無(wú)人工干預(yù)條件下,代碼生成、調(diào)試修正與結(jié)果分析的完整閉環(huán)執(zhí)行效率較國(guó)際同類產(chǎn)品提升顯著。

目前,ML-Master 2.0已進(jìn)入實(shí)際應(yīng)用階段,在理論計(jì)算物理模擬、具身智能機(jī)器人訓(xùn)練等前沿領(lǐng)域發(fā)揮關(guān)鍵作用。例如在量子材料研究中,系統(tǒng)通過(guò)自主設(shè)計(jì)實(shí)驗(yàn)方案,將傳統(tǒng)需要數(shù)月的模擬周期壓縮至兩周;在機(jī)器人控制領(lǐng)域,其持續(xù)優(yōu)化能力使機(jī)械臂操作精度突破行業(yè)基準(zhǔn)。這些實(shí)踐驗(yàn)證了AI科學(xué)家在真實(shí)科研場(chǎng)景中的可行性。

該系統(tǒng)的技術(shù)架構(gòu)已通過(guò)GitHub開源平臺(tái)向全球研究者開放,核心代碼包含認(rèn)知緩存管理、任務(wù)分解策略等創(chuàng)新模塊。同時(shí),SciMaster線上平臺(tái)正式啟動(dòng)體驗(yàn)申請(qǐng)通道,通過(guò)"SciMaster的朋友圈"社區(qū),科研人員可提前獲取系統(tǒng)使用權(quán)。配套的EigenAI基礎(chǔ)設(shè)施提供穩(wěn)定算力支持,確保系統(tǒng)在復(fù)雜任務(wù)中的持續(xù)運(yùn)行能力。

項(xiàng)目地址:
https://github.com/sjtu-sai-agents/ML-Master
SciMaster平臺(tái):
https://scimaster.bohrium.com/chat/

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容