久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

Allen人工智能研究所推出開源MolmoWeb:小尺寸網(wǎng)絡(luò)智能體展現(xiàn)新可能

   時(shí)間:2026-04-03 06:09 來源:快訊作者:馮璃月

Allen人工智能研究所(Ai2)近日宣布推出MolmoWeb,這是一款全新的開源視覺網(wǎng)絡(luò)智能體,隸屬于其Molmo 2模型家族。該模型提供40億和80億參數(shù)兩種版本,設(shè)計(jì)上兼顧了性能與輕量化,能夠在本地設(shè)備上運(yùn)行,為研究人員提供了更靈活的實(shí)驗(yàn)環(huán)境。

在功能實(shí)現(xiàn)上,MolmoWeb能夠模擬人類操作瀏覽器的完整流程:通過分析網(wǎng)頁截圖預(yù)測下一步動(dòng)作,執(zhí)行點(diǎn)擊、輸入文本或滾動(dòng)等操作,從而完成導(dǎo)航、表單填寫、商品搜索及信息檢索等任務(wù)。這種設(shè)計(jì)使其在標(biāo)準(zhǔn)瀏覽器使用基準(zhǔn)測試中表現(xiàn)突出,甚至超越了OpenAI早期版本的GPT-4o,同時(shí)在開放權(quán)重模型中領(lǐng)先于Fara-7B和GLM-4.1V-9B等競爭對手。

訓(xùn)練數(shù)據(jù)的規(guī)模與多樣性是MolmoWeb的另一大亮點(diǎn)。其公開的數(shù)據(jù)集包含3萬個(gè)真實(shí)人類任務(wù)軌跡,覆蓋1100多個(gè)網(wǎng)站的近60萬個(gè)子任務(wù),堪稱同類數(shù)據(jù)集中規(guī)模最大的公開資源。團(tuán)隊(duì)還通過可訪問性樹技術(shù)生成了補(bǔ)充合成數(shù)據(jù),并標(biāo)注了超過220萬個(gè)問答對,用于強(qiáng)化模型對網(wǎng)頁元素的理解能力。這些數(shù)據(jù)現(xiàn)已與模型權(quán)重、代碼及評估工具一同在Hugging Face和GitHub平臺開放下載。

Ai2團(tuán)隊(duì)指出,當(dāng)前開源社區(qū)在視覺網(wǎng)絡(luò)智能體領(lǐng)域面臨多重挑戰(zhàn):缺乏高質(zhì)量訓(xùn)練數(shù)據(jù)、基礎(chǔ)設(shè)施支持不足以及評估工具缺失,這些問題嚴(yán)重制約了研究的可復(fù)現(xiàn)性與進(jìn)展速度。MolmoWeb的發(fā)布旨在填補(bǔ)這一空白,為研究人員提供從數(shù)據(jù)到工具的完整生態(tài)。正如其研究論文所述:“今天的網(wǎng)絡(luò)智能體需要像早期大語言模型那樣的開放基礎(chǔ),以推動(dòng)整個(gè)領(lǐng)域的創(chuàng)新?!?/p>

盡管專有模型在整體性能上仍占據(jù)優(yōu)勢,但MolmoWeb的輕量化設(shè)計(jì)與開源特性使其在特定場景中更具吸引力。例如,研究人員可通過調(diào)整模型規(guī)?;蛴?xùn)練數(shù)據(jù),快速驗(yàn)證新算法在資源受限環(huán)境下的表現(xiàn)。這種靈活性不僅降低了研究門檻,也為未來更復(fù)雜的網(wǎng)絡(luò)交互任務(wù)奠定了基礎(chǔ)。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容