久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

智能體深度應用詞元消耗激增 降本增效路在何方?

   時間:2026-04-04 05:15 來源:快訊作者:顧雨柔

隨著人工智能技術在各領域的滲透,關于大模型使用中Token消耗與成本控制的討論日益成為焦點。Token作為大模型處理信息的最小單元,無論是日常提問還是生成內(nèi)容,每一次交互都伴隨著它的消耗。近期,智能體應用如“龍蝦”的興起,進一步推高了Token的使用需求,也讓成本問題愈發(fā)凸顯。

記者調(diào)查發(fā)現(xiàn),智能體產(chǎn)品落地初期,簡單交互場景的成本變化并不顯著,但深度使用場景中,Token消耗量會呈指數(shù)級增長,直接推高使用成本。個人用戶秦先生表示:“任務復雜度稍有提升,成本就明顯增加,Token消耗與任務難度不成正比,超出預期?!逼髽I(yè)層面的感受更為強烈——規(guī)模化應用AI的企業(yè)日均Token消耗已達百億級,以中交AI中心為例,其開發(fā)的數(shù)千個智能體日均消耗上百億Token,對應成本約十萬元。

持續(xù)增長的Token需求對算力系統(tǒng)構成挑戰(zhàn)。MiniMax稀宇科技副總裁嚴奕駿透露,公司每周都要進行算力擴容,算力資源始終處于“緊平衡”狀態(tài)。中國電信北京公司AI技術負責人陳哲詩觀察到,大模型技術演進拉動了應用層需求,算力租賃市場火爆,但客戶對成本敏感度較高,優(yōu)化基礎設施效率、降低Token成本成為行業(yè)共同訴求。

Token與手機流量的計費邏輯本質(zhì)不同。手機流量按傳輸量計費,緩存內(nèi)容可重復使用,成本清晰可控;而Token作為AI處理信息的計量單位,用戶需支付模型空間占用費、服務套餐費,每條指令執(zhí)行都會產(chǎn)生實時消耗,功能擴展或權限開放還會帶來額外支出。這種差異導致深度使用場景下,Token成本增長遠高于流量成本。

降低Token成本已成為行業(yè)共識。中國信息通信研究院云計算與數(shù)字化研究所主任馬飛分析,當前成本偏高源于行業(yè)處于發(fā)展初期,高端算力硬件成本高、資源利用率不足等多重因素疊加。隨著技術成熟和算力供給優(yōu)化,單位Token成本將逐步下降,需求爆發(fā)也將倒逼產(chǎn)業(yè)加速迭代。

企業(yè)正在通過多路徑降本。月之暗面Kimi企業(yè)業(yè)務負責人黃震昕表示,公司通過底層模型架構創(chuàng)新提升效率,直接降低Token成本;階躍星辰首席技術官朱亦博提出“智價比”概念,強調(diào)在保持模型智力水平的同時盡可能壓縮成本。云服務機構則從資源配置入手,天翼云智算平臺產(chǎn)品專家王曼介紹,通過算電協(xié)同、算網(wǎng)融合調(diào)度等技術,持續(xù)優(yōu)化成本結構。

國家層面算力布局為普惠化提供支撐。中國信通院發(fā)布的《算力互聯(lián)網(wǎng)體系架構研究報告》顯示,我國智能算力規(guī)模已居全球第二,但高端算力、核心算法仍存在外部依賴。當前,全國一體化算力網(wǎng)絡建設加速推進,通過統(tǒng)一調(diào)度優(yōu)化資源配置,算力服務可觸達性顯著提升。同時,輕量化、低功耗本土大模型的發(fā)展,讓更多普通用戶能夠以較低成本享受AI服務。

中國信通院云計算與數(shù)字化研究所副所長栗蔚認為,Token作為AI產(chǎn)業(yè)度量衡,其消耗總量反映應用深度,成本則體現(xiàn)算法算力效率。要實現(xiàn)Token普惠化,需構建優(yōu)質(zhì)算法、持續(xù)優(yōu)化模型,降低單Token算力消耗,并搭建隨需接入的算力節(jié)點網(wǎng)絡,讓AI服務真正走進千家萬戶。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容