久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來(lái)市場(chǎng)!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評(píng)論 旗下
洞察商業(yè) 啟迪未來(lái)

小米AI新突破:羅福莉領(lǐng)銜打造萬(wàn)億參數(shù)模型,獲林俊旸力贊

   時(shí)間:2026-03-20 18:43 來(lái)源:快訊作者:李娜

全球最大API聚合平臺(tái)OpenRouter上,一款名為Hunter Alpha的神秘模型在3月11日悄然上線。這款未標(biāo)注開(kāi)發(fā)者身份的模型以“隱身模式”發(fā)布,并免費(fèi)向開(kāi)發(fā)者開(kāi)放訪問(wèn)權(quán)限。測(cè)試數(shù)據(jù)顯示,其參數(shù)規(guī)模達(dá)1萬(wàn)億,上下文窗口支持100萬(wàn)token,且自稱是主要基于中文訓(xùn)練的中國(guó)AI模型,知識(shí)截止時(shí)間為2025年5月。由于這些特性與DeepSeek此前發(fā)布的模型風(fēng)格高度相似,市場(chǎng)一度猜測(cè)這是DeepSeek在秘密測(cè)試下一代系統(tǒng)。

短短七天內(nèi),Hunter Alpha的累計(jì)調(diào)用量突破1萬(wàn)億token,連續(xù)多日占據(jù)平臺(tái)榜單首位。然而,這一“黑馬”的真實(shí)身份很快被揭曉——小米MiMo團(tuán)隊(duì)正式認(rèn)領(lǐng)該模型,并確認(rèn)其為旗艦?zāi)P蚆iMo-V2-Pro的內(nèi)部測(cè)試版本。這一消息引發(fā)行業(yè)關(guān)注,因?yàn)樾∶状饲霸贏I領(lǐng)域并未展現(xiàn)出如此激進(jìn)的布局。更引人注目的是,小米AI團(tuán)隊(duì)的核心人物是前DeepSeek核心研究員羅福莉,她的技術(shù)背景為這一成果增添了更多解讀空間。

在近期的小米新品發(fā)布會(huì)上,雷軍正式推出了三款自研大模型:旗艦基座模型MiMo-V2-Pro、全模態(tài)理解模型MiMo-V2-Omni以及擬人語(yǔ)音大模型MiMo-V2-TTS。其中,MiMo-V2-Pro作為核心產(chǎn)品,總參數(shù)量達(dá)1萬(wàn)億,但通過(guò)稀疏化設(shè)計(jì)將激活參數(shù)控制在42B,支持1M超長(zhǎng)上下文窗口。這一架構(gòu)基于改進(jìn)的MoE(Mixture-of-Experts)體系,通過(guò)動(dòng)態(tài)激活部分子網(wǎng)絡(luò),在保持計(jì)算效率的同時(shí)擴(kuò)展了模型容量。其注意力機(jī)制采用分層組合的混合設(shè)計(jì),結(jié)合局部窗口注意力與全局注意力,有效解決了長(zhǎng)上下文場(chǎng)景下的推理退化問(wèn)題。

從應(yīng)用場(chǎng)景來(lái)看,MiMo-V2-Pro的定位突破了傳統(tǒng)語(yǔ)言模型的邊界。它不再以生成對(duì)話為核心目標(biāo),而是作為智能體系統(tǒng)的中樞,能夠理解任務(wù)目標(biāo)、規(guī)劃執(zhí)行路徑、調(diào)用外部工具,并在多階段過(guò)程中持續(xù)修正策略。例如,在代碼生成和自動(dòng)化任務(wù)中,模型可在單次上下文中保留完整的中間狀態(tài)、工具調(diào)用結(jié)果和歷史決策路徑,避免頻繁的上下文重建。這一特性使其在匿名測(cè)試階段就展現(xiàn)出顯著優(yōu)勢(shì),OpenRouter數(shù)據(jù)顯示,其使用場(chǎng)景高度集中在開(kāi)發(fā)工具和復(fù)雜任務(wù)執(zhí)行領(lǐng)域。

性能評(píng)估方面,MiMo-V2-Pro在通用Agent能力測(cè)試(Claweval)中得分61.5,接近Claude Opus 4.6的水平;在PinchBench測(cè)試中躋身全球前三,編碼能力甚至超越Claude Sonnet 4.6。更引人注目的是其定價(jià)策略:在256K上下文長(zhǎng)度內(nèi),輸入token單價(jià)為每百萬(wàn)1美元,輸出為每百萬(wàn)3美元;擴(kuò)展至100萬(wàn)上下文時(shí),輸入單價(jià)僅升至每百萬(wàn)2美元,輸出為每百萬(wàn)6美元,約為Claude Opus 4.6成本的五分之一。這一價(jià)格優(yōu)勢(shì)使其在商業(yè)應(yīng)用中具備顯著競(jìng)爭(zhēng)力。

羅福莉的技術(shù)路線選擇成為關(guān)注焦點(diǎn)。這位畢業(yè)于北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所的研發(fā)者,曾在阿里達(dá)摩院主導(dǎo)多語(yǔ)言預(yù)訓(xùn)練模型VECO的開(kāi)發(fā),并在DeepSeek期間參與MoE大模型DeepSeek-V2的核心設(shè)計(jì)。2025年11月加入小米后,她迅速組建團(tuán)隊(duì)并推進(jìn)1T基礎(chǔ)模型的訓(xùn)練。據(jù)其透露,模型最初的目標(biāo)是提升長(zhǎng)上下文推理效率,而混合注意力機(jī)制的創(chuàng)新設(shè)計(jì)使其成為智能體時(shí)代的理想基礎(chǔ)。她還在社交平臺(tái)分享了團(tuán)隊(duì)管理細(xì)節(jié),例如要求成員每天與AI對(duì)話不少于100次,并表示將在模型穩(wěn)定后考慮開(kāi)源。

小米的AI布局并非臨時(shí)起意。雷軍在發(fā)布會(huì)上透露,公司2025年的研發(fā)和資本投入將超過(guò)160億元,其中AI是重點(diǎn)方向。盡管此前在AI領(lǐng)域保持低調(diào),但MiMo-V2-Pro的發(fā)布標(biāo)志著小米正式加入大模型競(jìng)爭(zhēng)行列。在全球大模型綜合智能排行榜Artificial Analysis上,該模型已位列全球第八,按品牌排名則位居第五,超越了xAI Grok等競(jìng)爭(zhēng)對(duì)手。雷軍承認(rèn),小米的實(shí)際進(jìn)展可能比外界看到的更快,而持續(xù)投入將是其在AI時(shí)代保持競(jìng)爭(zhēng)力的關(guān)鍵。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容