久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來市場(chǎng)!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評(píng)論 旗下
洞察商業(yè) 啟迪未來

無需預(yù)訓(xùn)練僅76K參數(shù)!Mamba團(tuán)隊(duì)用最小描述長(zhǎng)度登ARC-AGI榜單前三

   時(shí)間:2025-12-16 04:04 來源:快訊作者:柳晴雪

無需大規(guī)模預(yù)訓(xùn)練,僅憑76K參數(shù)的神經(jīng)網(wǎng)絡(luò)模型,就能在通用人工智能(AGI)基準(zhǔn)測(cè)試中解決20%的難題——這一突破性成果來自最新研究CompressARC。該研究由卡內(nèi)基梅隆大學(xué)(CMU)博士生Isaac Liao主導(dǎo),其團(tuán)隊(duì)通過引入最小描述長(zhǎng)度(MDL)理論,顛覆了傳統(tǒng)智能依賴海量數(shù)據(jù)訓(xùn)練的認(rèn)知。在ARC-AGI-1基準(zhǔn)測(cè)試中,CompressARC成為首個(gè)僅依賴單個(gè)樣本推理的深度學(xué)習(xí)方法,并憑借此成果斬獲2025年ARC Prize第三名,更令人驚訝的是,整個(gè)研究?jī)H使用單張GPU完成。

傳統(tǒng)神經(jīng)網(wǎng)絡(luò)通過學(xué)習(xí)輸入到輸出的映射規(guī)則實(shí)現(xiàn)泛化,而CompressARC的核心邏輯截然不同:它試圖用最短的計(jì)算機(jī)程序“描述”給定的謎題。這一思路源于MDL理論——現(xiàn)象的最簡(jiǎn)程序表達(dá)往往蘊(yùn)含其本質(zhì)規(guī)律。在ARC-AGI場(chǎng)景中,模型需將謎題的輸入輸出對(duì)及測(cè)試輸入編碼為最短程序,程序長(zhǎng)度越短,意味著找到的規(guī)則越簡(jiǎn)潔本質(zhì)。研究團(tuán)隊(duì)遵循奧卡姆剃刀原理,假設(shè)最短程序具備最強(qiáng)泛化能力,因此完全摒棄外部訓(xùn)練集,僅依賴謎題本身的少量示例進(jìn)行推理。

ARC-AGI-1基準(zhǔn)測(cè)試要求模型通過少量示例(通常2-3對(duì)輸入輸出)推斷隱藏規(guī)則,并生成正確輸出網(wǎng)格,其設(shè)計(jì)初衷正是檢驗(yàn)AI的類人抽象推理能力。此前表現(xiàn)最優(yōu)的預(yù)訓(xùn)練大語(yǔ)言模型o3在該測(cè)試中得分88%,而未預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)最高分僅40.3%。CompressARC則另辟蹊徑:它不追求學(xué)習(xí)通用規(guī)則,而是針對(duì)每個(gè)謎題“定制”最短程序。實(shí)驗(yàn)顯示,在2000個(gè)推理訓(xùn)練步驟(約20分鐘/謎題)的預(yù)算下,模型成功解決20%的評(píng)估集謎題和34.75%的訓(xùn)練集謎題,盡管得分低于預(yù)訓(xùn)練模型,但其零數(shù)據(jù)依賴的特性為AGI研究開辟了新路徑。

技術(shù)實(shí)現(xiàn)層面,研究團(tuán)隊(duì)設(shè)計(jì)了固定程序模板,將尋找最短程序的問題轉(zhuǎn)化為優(yōu)化種子(硬編碼數(shù)值)和神經(jīng)網(wǎng)絡(luò)權(quán)重的問題。為解決組合搜索空間爆炸的難題,他們借鑒變分自編碼器(VAE)原理,通過KL散度懲罰隨機(jī)噪聲z的信息量,并用交叉熵衡量輸出與真實(shí)謎題的匹配度,從而將問題轉(zhuǎn)化為可微分的優(yōu)化任務(wù)。這一創(chuàng)新使梯度下降等深度學(xué)習(xí)標(biāo)準(zhǔn)方法得以應(yīng)用,避免了窮舉所有可能程序的計(jì)算不可行性。

模型架構(gòu)方面,CompressARC采用四大關(guān)鍵設(shè)計(jì):其一,內(nèi)置等變性處理,使網(wǎng)絡(luò)默認(rèn)賦予旋轉(zhuǎn)、翻轉(zhuǎn)等變換后的謎題相同概率,避免用冗長(zhǎng)代碼描述對(duì)稱性;其二,引入多張量數(shù)據(jù)結(jié)構(gòu),用不同形狀的張量存儲(chǔ)不同粒度信息,強(qiáng)化抽象推理能力;其三,核心骨干采用類Transformer結(jié)構(gòu),通過4層殘差連接和線性投影實(shí)現(xiàn)信息交互,但參數(shù)僅76K——大部分參數(shù)用于通道維度投影,核心操作本身無參數(shù);其四,定制無參數(shù)操作集,包括信息匯總傳播、單像素幾何平移、累積最大值拓?fù)洳僮鞯龋苯芋w現(xiàn)對(duì)謎題規(guī)則的先驗(yàn)知識(shí)。這些設(shè)計(jì)共同確保了程序描述的極致壓縮。

該研究挑戰(zhàn)了“智能必源于大規(guī)模預(yù)訓(xùn)練”的共識(shí),證明MDL與壓縮原理的結(jié)合可激發(fā)模型驚人的泛化能力。作者Isaac Liao目前專注于MDL、變分推斷及超網(wǎng)絡(luò)等領(lǐng)域,其本科與碩士均畢業(yè)于麻省理工學(xué)院(MIT),師從Mamba架構(gòu)提出者Albert Gu教授。而ARC-AGI基準(zhǔn)的創(chuàng)立者Fran?ois Chollet(Keras深度學(xué)習(xí)庫(kù)創(chuàng)始人、Google AI研究員)于2019年設(shè)計(jì)該測(cè)試時(shí),正是為了彌補(bǔ)傳統(tǒng)基準(zhǔn)在評(píng)估類人抽象推理能力上的不足——如今,CompressARC的突破為這一目標(biāo)提供了全新解決方案。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容