久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

螞蟻數(shù)科AoE框架:低成本輕量化方案破解具身數(shù)據(jù)采集難題

   時間:2026-03-03 18:03 來源:互聯(lián)網(wǎng)作者:蘇婉清

具身智能領(lǐng)域迎來一項關(guān)鍵技術(shù)進展——螞蟻數(shù)科天璣實驗室團隊開發(fā)的AoE持續(xù)性第一人稱視頻采集框架,成功攻克了低成本、規(guī)模化數(shù)據(jù)采集難題。該方案通過“手機+頸掛式支架”的輕量化組合,將傳統(tǒng)需要數(shù)萬美元的專業(yè)設(shè)備成本壓縮至20美元以內(nèi),為具身智能訓(xùn)練提供了可復(fù)制的解決方案。相關(guān)技術(shù)論文已在國際學(xué)術(shù)平臺Arxiv公開,標志著數(shù)據(jù)采集環(huán)節(jié)的技術(shù)壁壘被實質(zhì)性突破。

技術(shù)核心在于將人體自然交互過程轉(zhuǎn)化為標準化數(shù)據(jù)源。團隊設(shè)計的頸掛式支架采用人體工學(xué)結(jié)構(gòu),通過磁吸與機械夾具雙重固定方式,確保手機在胸前穩(wěn)定采集第一視角畫面。這種設(shè)計不僅支持毫米級軌跡追蹤,還能保持90%以上的手部關(guān)鍵點識別精度。實驗數(shù)據(jù)顯示,在Unitree G1機器人執(zhí)行關(guān)電腦任務(wù)中,僅需200條AoE采集的數(shù)據(jù),即可將操作成功率從45%提升至95%,顯著優(yōu)于傳統(tǒng)遙操作數(shù)據(jù)的訓(xùn)練效果。

針對長視頻處理難題,研究團隊構(gòu)建了端云協(xié)同的自動化流水線。端側(cè)輕量級視覺模型可實時識別手物交互行為并觸發(fā)精準錄制,大語言-視覺融合模型則將連續(xù)視頻切割為帶語義標簽的原子動作片段。云端系統(tǒng)進一步完成自動標注、異常數(shù)據(jù)過濾等處理,最終生成可直接用于模型訓(xùn)練的結(jié)構(gòu)化數(shù)據(jù)。這種處理方式使數(shù)千臺設(shè)備并發(fā)采集成為可能,同時將人工干預(yù)環(huán)節(jié)減少80%以上。

該技術(shù)的產(chǎn)業(yè)化應(yīng)用已進入快車道。AoE框架不僅解決了數(shù)據(jù)采集的“啟動學(xué)習(xí)”問題,更通過標準化流程降低了AI訓(xùn)練門檻。以金融場景為例,某銀行采用該方案后,柜員操作數(shù)據(jù)采集效率提升3倍,模型迭代周期縮短60%。這種低成本、高效率的數(shù)據(jù)生產(chǎn)模式,正在重塑具身智能的技術(shù)生態(tài)。

螞蟻數(shù)科的技術(shù)布局呈現(xiàn)明顯的產(chǎn)業(yè)導(dǎo)向特征。天璣實驗室同步推進AI+數(shù)據(jù)、AI+安全、AI+金融等四大方向,其研發(fā)的企業(yè)級大模型產(chǎn)品即將面世。今年初成立的“大模型技術(shù)創(chuàng)新部”,已啟動面向制造業(yè)、物流業(yè)的垂直領(lǐng)域模型開發(fā),預(yù)計年內(nèi)將落地5個以上行業(yè)解決方案。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容