久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來(lái)市場(chǎng)!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評(píng)論 旗下
洞察商業(yè) 啟迪未來(lái)

英偉達(dá)Groq 3 LPU登場(chǎng):與GPU協(xié)同,開(kāi)啟AI推理新時(shí)代

   時(shí)間:2026-03-17 21:29 來(lái)源:快訊作者:周琳

在近日舉辦的英偉達(dá)GTC大會(huì)上,一場(chǎng)關(guān)于AI計(jì)算架構(gòu)的革命性變革引發(fā)全球關(guān)注。英偉達(dá)創(chuàng)始人黃仁勛身著標(biāo)志性皮衣登臺(tái),宣布公司正式從"芯片制造商"向"AI基礎(chǔ)設(shè)施工廠"轉(zhuǎn)型,并公布了新一代Vera Rubin平臺(tái)的全貌——這個(gè)包含7款芯片的"全家桶"系統(tǒng),標(biāo)志著AI算力競(jìng)爭(zhēng)進(jìn)入系統(tǒng)級(jí)博弈的新階段。

核心突破來(lái)自名為Groq 3的語(yǔ)言處理單元(LPU)。這款采用500MB片上SRAM的芯片,通過(guò)150TB/s的內(nèi)存帶寬顛覆了傳統(tǒng)AI加速器的設(shè)計(jì)邏輯。相較于依賴HBM的GPU架構(gòu),LPU在解碼階段的帶寬優(yōu)勢(shì)達(dá)到7倍,特別適用于需要微秒級(jí)響應(yīng)的智能體交互場(chǎng)景。英偉達(dá)超大規(guī)模計(jì)算副總裁Ian Buck形象比喻:"GPU像卡車運(yùn)送海量貨物,LPU則是摩托車在擁堵城市中靈活穿梭。"

系統(tǒng)級(jí)整合成為關(guān)鍵創(chuàng)新。Vera Rubin平臺(tái)將Vera CPU、Rubin GPU與LPU通過(guò)NVLink-C2C技術(shù)連接,形成預(yù)填充-解碼的流水線作業(yè)模式。在演示中,集成72顆Rubin GPU和36顆Vera CPU的NVL72機(jī)架,訓(xùn)練萬(wàn)億參數(shù)模型所需的GPU數(shù)量減少75%,而推理能效比提升10倍。更引人注目的是,通過(guò)Dynamo軟件框架的智能調(diào)度,AI代理間的通信速度從每秒100token躍升至1500token。

制造環(huán)節(jié)的突破同樣值得關(guān)注。黃仁勛在演講中特別感謝三星電子,確認(rèn)其成為Groq 3 LPU的獨(dú)家代工廠。這款采用三星4nm工藝的芯片將于2026年第三季度量產(chǎn),首批256顆LPU組成的LPX機(jī)架可提供128GB片上內(nèi)存和640TB/s總帶寬。盡管單個(gè)LPU的內(nèi)存容量有限,但通過(guò)數(shù)量堆疊與液冷散熱設(shè)計(jì),英偉達(dá)構(gòu)建出全新的推理加速范式。

市場(chǎng)格局因此生變。傳統(tǒng)上在訓(xùn)練市場(chǎng)占據(jù)絕對(duì)優(yōu)勢(shì)的英偉達(dá),正通過(guò)LPU補(bǔ)齊推理領(lǐng)域的短板。測(cè)試數(shù)據(jù)顯示,新架構(gòu)在運(yùn)行萬(wàn)億參數(shù)模型時(shí),每瓦特推理性能提升35倍,每百萬(wàn)token成本降至45美元。這種性能躍升使得OpenAI、Anthropic等頭部企業(yè)成為潛在客戶,預(yù)計(jì)將率先在多智能體系統(tǒng)中部署該技術(shù)。

技術(shù)代價(jià)與工程妥協(xié)同樣明顯。SRAM的高成本與大面積占用,迫使英偉達(dá)采用機(jī)架級(jí)解決方案。每個(gè)LPX機(jī)架需要640TB/s的專用互聯(lián)接口,且芯片數(shù)量需求遠(yuǎn)超傳統(tǒng)架構(gòu)。Ian Buck承認(rèn):"從單位芯片的經(jīng)濟(jì)性看,LPU的token吞吐量成本并不占優(yōu)。"但英偉達(dá)認(rèn)為,在智能體交互成為主流的未來(lái),這種設(shè)計(jì)是必要的技術(shù)儲(chǔ)備。

這場(chǎng)變革也重塑了半導(dǎo)體供應(yīng)鏈。三星通過(guò)承接LPU代工訂單,從存儲(chǔ)供應(yīng)商升級(jí)為全面制造伙伴,與臺(tái)積電在AI芯片領(lǐng)域形成直接競(jìng)爭(zhēng)。而英偉達(dá)保持的CUDA生態(tài)兼容性,則確保現(xiàn)有客戶無(wú)需重構(gòu)代碼即可升級(jí)系統(tǒng),這種"軟硬協(xié)同"的策略可能成為其鞏固市場(chǎng)地位的關(guān)鍵。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容