久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

打破技術(shù)壁壘!小米發(fā)布開源VLA模型,消費(fèi)級顯卡實(shí)現(xiàn)機(jī)器人流暢運(yùn)行

   時間:2026-02-12 16:33 來源:天脈網(wǎng)作者:沈瑾瑜

小米機(jī)器人團(tuán)隊(duì)今日宣布,正式發(fā)布并開源全新具身智能VLA模型——Xiaomi-Robotics-0,其真機(jī)運(yùn)行畫面同步公開。這一成果標(biāo)志著小米在機(jī)器人領(lǐng)域?qū)崿F(xiàn)關(guān)鍵突破,以47億參數(shù)規(guī)模、視覺語言理解與高性能實(shí)時執(zhí)行能力的結(jié)合,在三大主流仿真測試中全面超越行業(yè)標(biāo)桿,斬獲全項(xiàng)SOTA(當(dāng)前最先進(jìn)水平),并在真實(shí)機(jī)器人上實(shí)現(xiàn)流暢動作執(zhí)行。

傳統(tǒng)機(jī)器人模型長期面臨兩大核心難題:一是推理延遲高導(dǎo)致動作斷層,模型在真實(shí)環(huán)境中反應(yīng)遲緩,難以完成連貫操作;二是硬件門檻過高,依賴專業(yè)顯卡運(yùn)行,限制了技術(shù)普及。小米此次發(fā)布的模型通過自研Mixture-of-Transformers(MoT)混合架構(gòu),創(chuàng)新性采用“雙腦協(xié)同系統(tǒng)”破解困局。其中,視覺語言大腦(VLM)負(fù)責(zé)理解模糊指令與環(huán)境感知,動作執(zhí)行小腦(DiT)則專注于生成流暢動作軌跡,二者通過流匹配技術(shù)實(shí)現(xiàn)精準(zhǔn)協(xié)同,從根源上消除機(jī)械卡頓現(xiàn)象。

技術(shù)團(tuán)隊(duì)設(shè)計的兩階段訓(xùn)練方案進(jìn)一步強(qiáng)化模型性能。初期跨模態(tài)預(yù)訓(xùn)練確保模型在掌握動作技能的同時,保留物體識別、視覺問答等基礎(chǔ)能力;后期通過異步推理模式與Clean Action Prefix技術(shù),解決真機(jī)運(yùn)行中的動作斷層問題,配合Λ-shape Attention Mask機(jī)制提升環(huán)境適應(yīng)力。實(shí)測顯示,該模型在分揀積木、拆解大塊積木、疊放毛巾等任務(wù)中表現(xiàn)卓越,尤其能主動整理多余毛巾,展現(xiàn)對柔性物體的精準(zhǔn)操控能力。

在Libero、Calvin、SimplerEnv三大國際測試集中,Xiaomi-Robotics-0對標(biāo)30余款主流模型,以全項(xiàng)SOTA成績穩(wěn)居行業(yè)第一梯隊(duì)。其顛覆性優(yōu)勢在于支持消費(fèi)級顯卡實(shí)時推理,普通開發(fā)者無需昂貴設(shè)備即可運(yùn)行模型,這一特性直接打破高端技術(shù)壟斷。小米同步開放技術(shù)主頁、GitHub代碼及Hugging Face模型權(quán)重,全球開發(fā)者可自由獲取資源進(jìn)行二次開發(fā),推動具身智能技術(shù)加速迭代。

雷軍在社交平臺透露,小米已持續(xù)深耕機(jī)器人領(lǐng)域多年,目前正面向全球招募頂尖人才,團(tuán)隊(duì)正全力研發(fā)下一代技術(shù)。此次發(fā)布的成果僅是階段性突破,未來將持續(xù)探索機(jī)器人技術(shù)的邊界。隨著Xiaomi-Robotics-0的開源,原本局限于實(shí)驗(yàn)室的高端技術(shù)正走向開放生態(tài),為行業(yè)創(chuàng)新注入新動能。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容