久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

AI模型評估賽道崛起:90后團(tuán)隊打造LMArena 獲1.5億美元融資估值17億

   時間:2026-01-07 23:46 來源:快訊作者:楊凌霄

AI大模型評估領(lǐng)域迎來一匹黑馬——LMArena正式宣布完成1.5億美元A輪融資,公司估值躍升至17億美元。這支由90后華人主導(dǎo)的團(tuán)隊,憑借獨(dú)特的評估模式和開源技術(shù)積累,在資本市場掀起熱潮。本輪融資由Felicis與加州大學(xué)投資公司UC Investments聯(lián)合領(lǐng)投,Andreessen Horowitz、The House Fund等知名機(jī)構(gòu)跟投。

故事要從2023年ChatGPT引發(fā)的AI革命說起。當(dāng)時由UC伯克利、斯坦福等頂尖高校學(xué)者組成的開源組織LMSYS,因開發(fā)出革命性的推理引擎SGLang嶄露頭角。該引擎首次實(shí)現(xiàn)96塊H100顯卡集群達(dá)到接近DeepSeek官方報告的吞吐量,現(xiàn)已被xAI、英偉達(dá)、阿里云等全球數(shù)十家科技企業(yè)采用。但真正讓團(tuán)隊出圈的,卻是他們?yōu)轵炞C自研模型Vicuna性能而打造的第三方評估平臺——Chatbot Arena。

"傳統(tǒng)基準(zhǔn)測試無法區(qū)分模型的真實(shí)水平。"LMSYS核心成員鄭憐憫回憶道。他們開創(chuàng)性地將模型匿名化,通過用戶實(shí)際交互投票決定優(yōu)劣。這種雙盲測試模式迅速吸引全球AI開發(fā)者,新模型發(fā)布前都會偷偷在這個平臺"打榜"。隨著影響力擴(kuò)大,2024年Chatbot Arena正式獨(dú)立為商業(yè)公司lmarena.ai,轉(zhuǎn)型專注AI模型評估賽道。

當(dāng)前主打的LMArena平臺構(gòu)建了三維評估體系:匿名對戰(zhàn)機(jī)制下,用戶提問后系統(tǒng)隨機(jī)匹配兩個模型匿名作答,投票后才揭曉身份;評分系統(tǒng)采用改進(jìn)版Elo算法,通過勝負(fù)關(guān)系動態(tài)調(diào)整分?jǐn)?shù);人機(jī)協(xié)同框架則通過算法平衡模型曝光度,避免"刷榜"行為。這種設(shè)計使評估結(jié)果兼具實(shí)時性與客觀性,成為行業(yè)公認(rèn)的"模型試金石"。

數(shù)據(jù)印證著平臺的爆發(fā)式增長:自2024年獲得1億美元種子輪融資后,累計收集5000萬張跨模態(tài)投票,完成400余種開放/專有模型評估,產(chǎn)出14.5萬個開源戰(zhàn)斗數(shù)據(jù)點(diǎn)。當(dāng)前排行榜上,Gemini 3 Pro以1490分領(lǐng)跑,OpenAI、Anthropic等頭部企業(yè)的模型均在此接受檢驗。資本的青睞與行業(yè)的認(rèn)可,讓這個由學(xué)術(shù)團(tuán)隊轉(zhuǎn)型的創(chuàng)業(yè)公司,在AI評估賽道走出獨(dú)特路徑。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容