久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

印奇履新后階躍星辰亮劍!Step 3.5 Flash開源,國產(chǎn)芯片適配助力AI新突破

   時間:2026-02-03 05:44 來源:快訊作者:楊凌霄

近日,人工智能領(lǐng)域迎來重要進展——階躍星辰正式開源其最新模型Step 3.5 Flash,并同步上線相關(guān)平臺。該模型在智能體場景與數(shù)學(xué)任務(wù)處理能力上已接近閉源模型水平,能夠高效完成復(fù)雜長鏈條任務(wù),被視為階躍星辰迄今性能最強的開源基座模型。

技術(shù)架構(gòu)方面,Step 3.5 Flash采用稀疏混合專家(MoE)設(shè)計,總參數(shù)量達1960億,但單個token僅需激活約110億參數(shù)。這種設(shè)計在保證模型能力的同時顯著提升了推理效率。針對長文本處理場景,該模型通過三路多Token預(yù)測技術(shù)實現(xiàn)每秒100-300個token的生成吞吐量,在單請求代碼類任務(wù)中峰值可達350TPS,并支持256K長度的文本理解與生成。

在性能測試中,Step 3.5 Flash展現(xiàn)強勁實力。數(shù)學(xué)競賽級任務(wù)方面,該模型在AIME 2025、IMOAnswerBench、HMMT 2025等測試中分別取得97.3、88.8、96.2分,開啟Parallel Thinking增強模式后性能躍居首位。編碼能力測試中,其在LiveCodeBench-V6獲得86.4分,增強模式下僅次于Gemini 3.0 Pro。智能體能力測試顯示,該模型在BrowseComp和xbench-DeepSearch測試中分別獲得69.0和54.0分,緊追行業(yè)領(lǐng)先水平。

實際應(yīng)用測試中,該模型展現(xiàn)出強大的任務(wù)處理能力。面對"9.9和9.11誰大"的數(shù)學(xué)問題,模型能快速給出正確答案,僅在數(shù)值輸出時出現(xiàn)9.9誤寫為99.9的小誤差。在復(fù)雜計算任務(wù)中,模型可準(zhǔn)確計算等差數(shù)列求和、立方和、階乘和等數(shù)學(xué)問題。智能體編程測試中,模型根據(jù)文字描述自動生成可調(diào)節(jié)海浪頻率的模擬平臺,并成功構(gòu)建包含15000個動態(tài)節(jié)點的氣象情報儀表盤,展現(xiàn)出強大的地理空間可視化能力。

多智能體協(xié)作方面,Step 3.5 Flash采用分層框架設(shè)計,主智能體通過動態(tài)路由協(xié)調(diào)"搜索""驗證"等子智能體并行工作。在價格對比任務(wù)中,模型將"查詢Mac Mini M4各平臺價格"的需求拆解為淘寶、京東、拼多多三個子任務(wù),最終精準(zhǔn)識別出最低價平臺并提供購買建議。這種云端規(guī)劃能力顯著降低了本地執(zhí)行難度,提升了數(shù)據(jù)抓取成功率。

該模型的開源已獲得產(chǎn)業(yè)界廣泛支持,華為昇騰、沐曦股份、壁仞科技等六家芯片廠商率先完成適配。模型可在Mac Studio M4 Max等消費級硬件上安全運行,在保證數(shù)據(jù)私密性的同時維持高性能表現(xiàn)。據(jù)透露,階躍星辰已啟動Step 4模型的訓(xùn)練工作,持續(xù)聚焦智能體基礎(chǔ)模型研發(fā)。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容