久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來市場(chǎng)!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評(píng)論 旗下
洞察商業(yè) 啟迪未來

谷歌Gemini 3發(fā)布即登頂:碾壓競(jìng)品獲贊,憑TPU優(yōu)勢(shì)成AI新王者

   時(shí)間:2025-11-19 15:42 來源:天脈網(wǎng)作者:顧雨柔

谷歌最新人工智能模型Gemini 3正式登場(chǎng),一經(jīng)發(fā)布便在行業(yè)內(nèi)引發(fā)巨大反響。這款被谷歌首席執(zhí)行官桑達(dá)爾·皮查伊盛贊為“最智能模型”的產(chǎn)品,早在發(fā)布前就備受關(guān)注,如今終于揭開神秘面紗,展現(xiàn)出強(qiáng)大的實(shí)力。

與早期小步快跑的探索模式不同,Gemini 3的發(fā)布是一次全面且充分的展示。據(jù)Gemini團(tuán)隊(duì)介紹,它不僅是全球領(lǐng)先的多模態(tài)理解模型,更是目前最強(qiáng)大的智能體和氛圍編程模型,其基礎(chǔ)是先進(jìn)的推理能力。網(wǎng)友們?cè)诳吹紾emini 3的評(píng)測(cè)表現(xiàn)后紛紛驚嘆,直言終于明白谷歌為何能成為股神巴菲特的“心頭好”。

Gemini 3的發(fā)布可謂不給競(jìng)爭(zhēng)對(duì)手留機(jī)會(huì),在各大評(píng)測(cè)集中表現(xiàn)卓越。它以1501分的成績(jī)強(qiáng)勢(shì)奪回LMArena大模型競(jìng)技場(chǎng)榜首位置,超越了此前馬斯克xAI發(fā)布的Grok 4.1模型。從測(cè)試結(jié)果來看,Gemini 3 Pro憑借領(lǐng)先的推理能力和強(qiáng)大的多模態(tài)功能,性能顯著超越前一代的Gemini 2.5 Pro,對(duì)OpenAI的最新模型GPT - 5.1更是呈現(xiàn)出“碾壓”態(tài)勢(shì)。

在“人類終極考試”中,Gemini 3 Pro未使用任何工具,得分率就達(dá)到了37.5%;在GPQA Diamond基準(zhǔn)測(cè)試中,準(zhǔn)確率高達(dá)91.9%;在“地獄模式”數(shù)學(xué)測(cè)試MathArena Apex中,以23.4%的成績(jī)達(dá)到最先進(jìn)水平,為數(shù)學(xué)領(lǐng)域的前沿模型樹立了新標(biāo)桿。除了文本能力,Gemini 3 Pro在MMMU - Pro上取得81%的成績(jī),在Video - MMMU上達(dá)到87.6%,在SimpleQA Verified基準(zhǔn)測(cè)試中也獲得了72.1%的當(dāng)前最先進(jìn)得分,展現(xiàn)出在事實(shí)準(zhǔn)確性方面的顯著進(jìn)步,具備解決跨越科學(xué)和數(shù)學(xué)等廣泛主題復(fù)雜問題的能力。在AI界的圖靈測(cè)試“ARC - AGI - 2”中,Gemini 3 Pro拿下31.1%的高分,遠(yuǎn)超GPT - 5.1的17.6%,這表明AI開始展現(xiàn)出類似人類的智力和思維方式,能在未見過的任務(wù)模式下進(jìn)行推理。

Gemini 3的出色表現(xiàn)也得到了行業(yè)大佬的認(rèn)可。OpenAI聯(lián)合創(chuàng)始人、CEO山姆·奧特曼發(fā)推評(píng)價(jià)“Gemini 3看起來很不錯(cuò)”,xAI創(chuàng)始人、CEO埃隆·馬斯克也表示“干得很好”。

即日起,Gemini全面融入谷歌的產(chǎn)品生態(tài),這也是谷歌首次在產(chǎn)品發(fā)布當(dāng)日就將Gemini引入搜索領(lǐng)域。同時(shí),Gemini 3同步向Gemini app用戶、AI Studio和Vertex AI的開發(fā)者,以及全新的智能體開發(fā)平臺(tái)Google Antigravity推出,彰顯出谷歌用AI定義整個(gè)生態(tài)每個(gè)支點(diǎn)的平臺(tái)級(jí)野心。

本次發(fā)布的Gemini 3 Pro深度思考版本模型雖尚未全面開放,但從測(cè)試表現(xiàn)可知其Benchmark水平比Gemini 3 Pro高出一個(gè)數(shù)量級(jí)。谷歌表示,將在未來幾周向Google AI Ultra訂閱者開放,目前該模型還在進(jìn)行安全評(píng)估。

Gemini 3的功能十分強(qiáng)大且多樣。它可以編寫代碼來可視化托卡馬克中的等離子體流動(dòng),還能創(chuàng)作詩歌捕捉聚變的物理原理。如果用戶想學(xué)習(xí)家族傳統(tǒng)菜肴,它能解讀并翻譯不同語言的手寫食譜,生成可分享的食譜。對(duì)于想學(xué)習(xí)新領(lǐng)域知識(shí)的用戶,把學(xué)術(shù)論文、講座視頻等素材提供給Gemini 3,它能生成交互式記憶卡片、可視化或其他格式的代碼,幫助用戶掌握相關(guān)知識(shí)。它還能充當(dāng)教練角色,觀看打球運(yùn)動(dòng)視頻指出改進(jìn)之處并生成訓(xùn)練計(jì)劃。在搜索模式下,使用Gemini 3可實(shí)現(xiàn)新的生成式UI體驗(yàn),如沉浸式視覺布局、交互式工具和模擬等。它還能編寫擁有豐富可視化界面和互動(dòng)性的3D飛船游戲、可玩的科幻世界以及更具實(shí)用性的網(wǎng)頁等,令極客論壇上的前端開發(fā)者感嘆其不僅能高效寫代碼,還能理解審美,動(dòng)畫效果恰到好處。

2025年,AI行業(yè)“模型即智能體”的熱潮席卷全球,大模型從被動(dòng)的“預(yù)測(cè)引擎”升級(jí)為主動(dòng)的“行動(dòng)實(shí)體”,具備自主決策和執(zhí)行能力。然而,to C智能體產(chǎn)品普遍面臨“叫好不叫座”的困境,用戶體驗(yàn)可靠好用的產(chǎn)品較少,這背后考驗(yàn)的是基礎(chǔ)模型推理、工具運(yùn)用與任務(wù)規(guī)劃的綜合實(shí)力。Gemini 3率先取得突破,成為第一個(gè)在模型界面融入通用Agent能力并支持執(zhí)行多種復(fù)雜任務(wù)的產(chǎn)品。其工具使用能力相比2.5 Pro提升了30%,不僅能更準(zhǔn)確選擇正確工具,還能理解何時(shí)需要不同工具組合完成復(fù)雜任務(wù)。

此次發(fā)布中,谷歌還帶來了全新Agent開發(fā)平臺(tái)Google Antigravity。借助Gemini 3的高級(jí)推理、工具使用和智能編碼能力,Google Antigravity將AI輔助從開發(fā)者工具包中的工具轉(zhuǎn)變?yōu)榛钴S伙伴。雖然其核心仍沿用熟悉的AI集成開發(fā)環(huán)境(IDE),但智能體被提升到專屬界面,可直接訪問編輯器、終端和瀏覽器,能代表開發(fā)者自主規(guī)劃和執(zhí)行復(fù)雜的端到端軟件任務(wù),并自行驗(yàn)證代碼。

谷歌還提到,Gemini 3是迄今為止最安全的模型,接受了Google AI模型中最全面的一套安全評(píng)估,展現(xiàn)出更低的諂媚性、更高的抗提示注入能力,并強(qiáng)化了抵御網(wǎng)絡(luò)攻擊濫用的保護(hù)措施。值得一提的是,Gemini 3的訓(xùn)練完全基于自家TPU,在全球AI公司等待英偉達(dá)GPU發(fā)貨時(shí),谷歌有肆意擴(kuò)張參數(shù)的底氣。隨著Gemini 3加入模型“角斗場(chǎng)”,谷歌宣告王者歸來,圍繞大模型的新一輪競(jìng)爭(zhēng)已全面打響。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容