久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

ClawBench大模型榜單揭曉:智譜字節(jié)小米四款模型強勢闖入全球前十

   時間:2026-04-01 03:52 來源:快訊作者:蘇婉清

全球知名評測機構(gòu)ClawBench最新發(fā)布的大型模型榜單引發(fā)行業(yè)關(guān)注,北京三家人工智能企業(yè)的四款模型成功躋身全球前十,展現(xiàn)了中國AI技術(shù)的強勁實力。其中智譜科技研發(fā)的GLM-5-Turbo以93.9分的絕對優(yōu)勢登頂榜首,字節(jié)跳動旗下的豆包模型Doubao-Seed-2.0-lite緊隨其后位列第二,同時憑借最低的使用成本成為最具性價比的模型。

小米科技成為本次榜單的最大黑馬,其自主研發(fā)的MiMo-V2系列兩款模型同時入圍前十。MiMo-V2-Omni憑借卓越的運行速度斬獲第九名,而功能更強大的MiMo-V2-Pro在復(fù)雜邏輯推理、長指令遵循等核心維度表現(xiàn)突出,在Model Rank專業(yè)排名中位居全球第五。該機構(gòu)數(shù)據(jù)顯示,小米在實驗室綜合研發(fā)能力評估中同樣表現(xiàn)亮眼,在Text Arena(ArenaExpert)和Code Arena兩大權(quán)威榜單中分別位列全球第四和第五,綜合研發(fā)實力僅次于Anthropic、OpenAI和谷歌三家國際頂尖機構(gòu)。

ClawBench采用的評測機制具有顯著創(chuàng)新性,其關(guān)聯(lián)的Text Arena榜單通過雙盲測試模式,在完全隱藏模型身份的前提下,由全球真實用戶根據(jù)實際使用體驗進行投票評選。這種評測方式有效規(guī)避了傳統(tǒng)榜單中針對特定數(shù)據(jù)集進行優(yōu)化的"刷榜"行為,確保評測結(jié)果能夠真實反映模型在真實場景中的表現(xiàn),為行業(yè)提供了更具參考價值的評估標準。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容