滾動資訊

當(dāng)前位置：發(fā)現(xiàn)者網(wǎng) > 產(chǎn)業(yè)經(jīng)濟 > 正文內(nèi)容

Mamba團隊新突破：無預(yù)訓(xùn)練僅76K參數(shù)模型躋身ARC-AGI前三

時間：2025-12-17 01:07 來源：快訊作者：任飛揚

在人工智能研究領(lǐng)域，一項名為CompressARC的新成果引發(fā)了廣泛關(guān)注。這項由Mamba團隊核心成員Albert Gu指導(dǎo)、CMU博士生Isaac Liao主導(dǎo)的研究，通過顛覆傳統(tǒng)訓(xùn)練范式，在通用智能測試基準(zhǔn)ARC-AGI-1上取得突破性進(jìn)展——僅用76K參數(shù)的未預(yù)訓(xùn)練模型，便在評估集中解決了20%的謎題。

與傳統(tǒng)依賴海量數(shù)據(jù)預(yù)訓(xùn)練的模型不同，CompressARC開創(chuàng)性地采用"最小描述長度"（MDL）理論作為核心框架。該理論源于數(shù)學(xué)與計算機科學(xué)交叉領(lǐng)域，其核心思想認(rèn)為：揭示現(xiàn)象本質(zhì)規(guī)律的程序，往往具有最簡潔的代碼形式。研究團隊將這一哲學(xué)轉(zhuǎn)化為技術(shù)實踐——通過構(gòu)建能生成目標(biāo)謎題的最短計算機程序，使模型在推理階段自動學(xué)習(xí)隱含規(guī)則，而非被動記憶訓(xùn)練數(shù)據(jù)。

實驗設(shè)計極具挑戰(zhàn)性：模型僅能接觸每個謎題的2個示例輸入/輸出對及1個測試輸入，完全不依賴外部訓(xùn)練集。這種"單樣本學(xué)習(xí)"模式，迫使系統(tǒng)必須從有限信息中抽象出通用規(guī)則。為解決程序搜索空間爆炸的難題，研究團隊設(shè)計了包含固定運算流程的模板程序，將問題轉(zhuǎn)化為尋找最優(yōu)種子值和神經(jīng)網(wǎng)絡(luò)權(quán)重的優(yōu)化過程。

技術(shù)實現(xiàn)層面，模型架構(gòu)融合了多項創(chuàng)新：通過等變設(shè)計內(nèi)置對旋轉(zhuǎn)、翻轉(zhuǎn)等幾何變換的天然理解；采用多張量數(shù)據(jù)結(jié)構(gòu)存儲不同粒度的空間關(guān)系；核心運算模塊包含專門設(shè)計的幾何操作（如單像素平移）和拓?fù)洳僮鳎ㄈ缋鄯e最大值），這些無參數(shù)操作直接編碼了對抽象推理任務(wù)的先驗知識。整個網(wǎng)絡(luò)僅76K參數(shù)，其中90%用于通道維度的線性投影，核心邏輯通過硬編碼操作實現(xiàn)。

在優(yōu)化算法上，研究團隊借鑒變分自編碼器原理，將程序長度最小化轉(zhuǎn)化為可微分問題。通過同時最小化KL散度（控制隨機噪聲z的信息量）和交叉熵（衡量輸出與真實謎題的匹配度），系統(tǒng)能在梯度下降過程中自動平衡規(guī)則復(fù)雜度與重構(gòu)精度。這種設(shè)計使模型能用2000個推理步驟（約20分鐘/謎題）完成訓(xùn)練，在評估集中達(dá)到20%的準(zhǔn)確率，訓(xùn)練集準(zhǔn)確率更高達(dá)34.75%。

對比現(xiàn)有方法，該成果具有顯著差異：基于互聯(lián)網(wǎng)數(shù)據(jù)預(yù)訓(xùn)練的o3模型雖在評估中取得88%的準(zhǔn)確率，但其參數(shù)規(guī)模達(dá)數(shù)十億級；同類未預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的最高成績?yōu)?0.3%，但需接觸整個ARC-AGI訓(xùn)練集。CompressARC的突破在于證明：通過壓縮原理引導(dǎo)的智能涌現(xiàn)，可能成為通往通用人工智能的獨立路徑。

這項研究的核心基準(zhǔn)ARC-AGI-1由GoogleAI研究員Fran?ois Chollet于2019年提出，旨在評估AI處理未明確訓(xùn)練過的新問題的能力。該測試包含80個手工設(shè)計的抽象推理謎題，涵蓋對象操作、模式識別、空間變換等認(rèn)知任務(wù)，被學(xué)界視為衡量通用智能的核心標(biāo)尺。CompressARC的成果，為破解這一挑戰(zhàn)提供了全新視角。

研究團隊負(fù)責(zé)人Isaac Liao的學(xué)術(shù)背景同樣引人注目：這位MIT計算機科學(xué)與物理學(xué)雙學(xué)位獲得者，在CMU攻讀博士期間專注于最小描述長度理論、變分推斷等前沿領(lǐng)域。其導(dǎo)師Albert Gu作為Mamba架構(gòu)的提出者，此次合作再次驗證了跨學(xué)科研究在推動AI范式變革中的關(guān)鍵作用。

更多>同類內(nèi)容

2025動態(tài)IP性能大揭秘：三維度對比，助你選對服務(wù)商

穩(wěn)定性高的服務(wù)商意味著IP切換更平滑、網(wǎng)絡(luò)中斷更少，這對數(shù)據(jù)抓取測試、跨區(qū)域訪問、用戶體驗優(yōu)化等場景尤為關(guān)鍵。 2.1 青果網(wǎng)絡(luò)：性能排名首位的穩(wěn)定與高可用青果網(wǎng)絡(luò)在2025年度的動態(tài)IP測試中表現(xiàn)尤為突出。…

12-17

雙十一靜悄悄？拆解1.7萬億數(shù)據(jù)，省時安心等“隱藏福利”成新寵

12-17

石頭科技12月15日股價下跌3.13% 主力資金凈流入超千萬元游資亦呈流入態(tài)勢

12月15日的資金流向數(shù)據(jù)方面，主力資金凈流入1187.26萬元，占總成交額1.95%，游資資金凈流入2854.64萬元，占總成交額4.7%，散戶資金凈流出4041.89萬元，占總成交額6.65%。石頭科…

12-16

米多多赴港IPO：尚未盈利負(fù)債率高，創(chuàng)始人與CEO持股比例引關(guān)注

根據(jù)灼識咨詢的資料，以2024年的收入計算，米多多集團為中國第五大跨境電商服務(wù)供應(yīng)商。公司的數(shù)字解決方案讓企業(yè)客戶通過Google、TikTok、Meta及Amazon等國際領(lǐng)先的數(shù)字媒體平臺觸達(dá)目標(biāo)海外消…

12-16

2025消費行業(yè)新洞察：人口、品類、渠道、技術(shù)、資本的五大趨勢

12-16

AI算力熱潮涌動，芯原股份盈利拐點將至卻遇股東減倉與重組終止

12-16

企商在線王新鉦當(dāng)選全國工商聯(lián)人工智能委員助力AI產(chǎn)業(yè)融合發(fā)展

12-16

招商證券董事長霍達(dá)忙拓展：半年減員千余人，瞄準(zhǔn)境外謀發(fā)展

12-16

國產(chǎn)射頻芯片新勢力！昂瑞微科創(chuàng)板上市首日股價大漲160.11%

12-16

營養(yǎng)包成分解析：從科學(xué)認(rèn)知到市場選擇，如何滿足多元健康需求？

12-16

澳大利亞旺季全解析：圣誕至盛夏，解鎖消費熱點與持續(xù)商機

12-16

青藏高原矗立世界之巔風(fēng)力發(fā)電場綠色引擎驅(qū)動生態(tài)與經(jīng)濟雙贏

12-16

信和集團半年內(nèi)三大商場引入26家餐飲與OpenRice攜手共促消費增長

12-16

2025兩岸企業(yè)家峰會南京啟幕八百嘉賓共探轉(zhuǎn)型創(chuàng)新多鏈合作新路徑

12-16

2025保險業(yè)資本“輸血”超1500億，增資發(fā)債多元，哪些領(lǐng)域成資本“寵兒”？

12-16

點擊查看更多 +

全站最新

L4級自動駕駛浪潮下，奔馳攜豪華基因入局重塑出行新標(biāo)桿

東風(fēng)日產(chǎn)N7：精準(zhǔn)錨定家庭需求，銷量口碑雙突破引領(lǐng)合資破局

德系運動與智能科技交融，奧迪E5 Sportback輔助駕駛開啟“劈彎”新體驗

石頭科技12月15日股價下跌3.13% 主力資金凈流入超千萬元游資亦呈流入態(tài)勢

米多多赴港IPO：尚未盈利負(fù)債率高，創(chuàng)始人與CEO持股比例引關(guān)注

360前高管指控財務(wù)造假 360集團及周鴻祎發(fā)聲明回應(yīng)

熱門內(nèi)容

本欄最新

石頭科技12月15日股價下跌3.13% 主力資金凈流入超千萬元游資亦呈流入態(tài)勢

米多多赴港IPO：尚未盈利負(fù)債率高，創(chuàng)始人與CEO持股比例引關(guān)注

鋁代銅浪潮席卷19家空調(diào)企業(yè)，董明珠堅守質(zhì)量底線：格力暫不跟進(jìn)

華為終端高層變動：余承東接任董事長孟晚舟徐直軍等卸任董事

馬斯克質(zhì)疑小型聚變反應(yīng)堆：太陽才是天然免費能量源，呼吁停止浪費資金

2025企業(yè)家香江論壇啟幕共探全球華商發(fā)展新動能與未來藍(lán)圖

發(fā)現(xiàn)者網(wǎng) - 深度洞察行業(yè)動態(tài) 引領(lǐng)市場先鋒平臺 - 發(fā)現(xiàn)商業(yè)評論旗下網(wǎng)站北京·通州天津·濱海山東·濟南
發(fā)現(xiàn)者網(wǎng)（www.ruruan.com.cn）所有稿件免費開放轉(zhuǎn)載，轉(zhuǎn)載請務(wù)必保留版權(quán)。
合作微信：netspread（注明:發(fā)現(xiàn)者網(wǎng)）
Copyright ? FXW 2012-2023 www.ruruan.com.cn All rights reserved. 魯ICP備2022032383號-3