久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

華為Atlas 350加速卡上市:國內(nèi)首推FP4低精度推理,算力碾壓英偉達H20

   時間:2026-03-22 01:07 來源:ITBEAR作者:蘇婉清

在華為中國合作伙伴大會上,華為正式宣布Atlas 350加速卡正式上市銷售。這款加速卡搭載昇騰950PR處理器,標志著華為在去年首次介紹該芯片后,成功將其推向市場。華為昇騰計算業(yè)務總裁張迪煊在會上透露,Atlas 350的單卡算力達到英偉達H20的2.87倍,成為國內(nèi)首款支持FP4低精度推理的產(chǎn)品。其HBM容量為112GB,是H20的1.16倍,多模態(tài)生成速度提升60%,內(nèi)存訪問顆粒度從512字節(jié)減少至128字節(jié),小算子訪存效率提高4倍。

FP4低精度支持是Atlas 350的核心優(yōu)勢之一。觀察者網(wǎng)梳理發(fā)現(xiàn),英偉達當前計劃在中國銷售的H200芯片并不支持原生FP4,僅在其更先進的Blackwell架構中引入該技術。FP4通過降低計算精度換取效率,使700億參數(shù)的模型僅需35GB顯存即可單卡運行,推理延遲顯著降低,而FP16則需要140GB顯存。這一特性使Atlas 350在推理場景中具備顯著優(yōu)勢。

在硬件指標方面,Atlas 350的FP4精度算力達1.56P,帶寬為1.4TB/s,功耗為600W,是英偉達H20的1.5倍。華為副總裁馬海旭介紹,昇騰950系列分為PR和DT兩個版本,前者面向預填充和推薦場景,采用自研低成本HBM技術,可大幅降低推理階段的投資成本。盡管單卡性能與英偉達H20相當,但在FP8/FP16算力及顯存帶寬上,仍與H200存在差距。

針對大規(guī)模訓練場景,華為提出超節(jié)點戰(zhàn)略。在今年的巴展上,華為展示了Atlas 950超節(jié)點,支持8192張昇騰950DT卡通過“靈衢”全光互聯(lián)技術連接。清華大學計算機系教授鄭緯民表示,超節(jié)點憑借超高帶寬、超低時延和內(nèi)存統(tǒng)一編址等特點,已成為AI基礎設施建設的核心方向。該技術已在互聯(lián)網(wǎng)、電信和制造等行業(yè)落地,證明其能有效實現(xiàn)算力的規(guī)模化擴展。

技術突破之外,生態(tài)建設成為華為的重點。馬海旭宣布,華為將于2025年8月5日全面開源昇騰軟件,目前CANN等軟件已完成架構解耦,安裝包從8個拆分為29個,編譯效率提升58%。華為還支持三方開源生態(tài),累計為50多個社區(qū)和項目貢獻650多個關鍵特性。張迪煊以智譜為例,稱其基于昇騰在3個月內(nèi)完成多模態(tài)大模型GLM-Image的訓練,該模型登頂全球開源社區(qū)Hugging Face的榜單,證明昇騰可訓練世界級模型。

面對企業(yè)多樣化的算力需求,華為推出分級產(chǎn)品。張迪煊介紹,昇騰面向百億級模型推出A2標卡,內(nèi)存帶寬達業(yè)界1.8倍;千億級模型提供單機服務器,算力為業(yè)界2.3倍;萬億級模型采用雙機超節(jié)點服務器,整機算力達業(yè)界3.78倍。華為與伙伴合作推出400多款行業(yè)一體機,服務2700多家客戶,占據(jù)國內(nèi)一體機市場80%以上份額。

市場預測顯示,華為在中國AI加速器市場的份額有望提升。根據(jù)Bernstein Research的報告,2026年華為的收入占比預計達50%,英偉達受禁售影響或降至8%,AMD升至12%,海光、寒武紀等企業(yè)分別占據(jù)8%和9%的份額,其余廠商份額在1%-3%之間。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容