久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

馬斯克xAI新模型Grok 4.2公測,通過趣味測試,回答傾向引發(fā)熱議

   時間:2026-02-18 18:28 來源:快訊作者:孫雅

馬斯克旗下xAI公司推出的Grok 4.2公測版近日悄然上線,盡管團隊近期經(jīng)歷高層動蕩,這款新模型仍成為科技圈焦點。與當前主流大模型動輒萬億參數(shù)的規(guī)模不同,Grok 4.2僅采用5000億參數(shù)架構(gòu),這種"輕量化"設(shè)計在測試階段引發(fā)了截然相反的評價。

馬斯克在社交平臺連續(xù)轉(zhuǎn)發(fā)十余條用戶好評,并親自下場"公關(guān)":"當前版本仍有缺陷,但公測結(jié)束后將比前代快得多、聰明得多。模型具備每周自我迭代能力,未來會持續(xù)進化。"據(jù)技術(shù)團隊披露,新架構(gòu)引入實時反饋機制,使模型能像人類一樣通過實踐快速優(yōu)化,這種動態(tài)更新模式區(qū)別于傳統(tǒng)靜態(tài)升級邏輯。

測試階段暴露的爭議尤為突出。支持者展示其通過"弱智吧"風(fēng)格邏輯測試的案例——當被問及"50米外洗車店該開車還是步行"時,模型準確識別出距離過近的矛盾性。另有用戶證實其成功通過涉及性別認知的敏感測試,這項曾讓ChatGPT陷入爭議的題目,成為Grok 4.2的加分項。代碼生成和多模態(tài)處理能力也獲得開發(fā)者認可,部分測試顯示其響應(yīng)速度超越競品。

反對聲音則聚焦于參數(shù)規(guī)模限制。深度用戶指出,在處理復(fù)雜邏輯推理時,5000億參數(shù)明顯力不從心,有開發(fā)者調(diào)侃:"馬斯克說的'橫掃榜單'可能只在特定實驗室環(huán)境成立。"更尖銳的批評指向模型偏見問題,測試顯示多個回答與馬斯克個人觀點高度吻合,這與他宣稱的"無偏見"原則形成反差。成本爭議同樣存在,有消息稱其訓(xùn)練成本高于同類模型。

技術(shù)細節(jié)的缺失加劇了討論的兩極分化。xAI至今未發(fā)布完整技術(shù)報告,公開的評測數(shù)據(jù)僅限于部分排行榜成績。這種信息透明度引發(fā)兩種猜測:要么模型尚未成熟,要么團隊在刻意保持神秘感。值得注意的是,馬斯克轉(zhuǎn)發(fā)確認了AI工程師Mark Krechman的爆料——當前版本只是"小尺寸"試水,中大型版本將在后續(xù)推出。

在模型公測同期,xAI還低調(diào)上線了Grok imagine視頻生成工具,目前僅支持iOS平臺。這項新功能與模型升級形成互補,顯示出團隊在多模態(tài)領(lǐng)域的布局野心。隨著公測持續(xù)至下月,這場關(guān)于參數(shù)規(guī)模、更新模式與商業(yè)化的爭論,或?qū)⒁蚋鄬崪y數(shù)據(jù)披露而迎來新轉(zhuǎn)折。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容