">

首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經濟|智能汽車|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|大數(shù)據(jù)|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 人工智能 >> 正文

“價格屠夫”DeepSeek上線,新模型成本下降超50%

2025年9月30日 07:14  第一財經  

被稱為“價格屠夫”的DeepSeek再次揮刀降價了。

9月29日晚間,DeepSeek宣布正式發(fā)布 DeepSeek-V3.2-Exp模型,性能仍是穩(wěn)步提升,但出乎意料的是,調用價格大幅降低,尤其輸出價格大降75%,業(yè)界人士表示“這很難卷得過”。DeepSeek提到,在新價格政策下,開發(fā)者調用DeepSeek API的成本將降低50%以上。

具體來看,輸入價格上,緩存命中時,DeepSeek-V3.2-Exp從0.5元/百萬tokens降至0.2元/百萬tokens,緩存未命中的價格則從4元/百萬tokens降為2元/百萬tokens;輸出價格上,從12元/百萬tokens直接降到了3元/百萬tokens。

降價原因方面,DeepSeek介紹是得益于新模型服務成本的大幅降低。V3.2-Exp是一個實驗性(Experimental)的版本,作為邁向新一代架構的中間步驟,在 V3.1-Terminus 的基礎上這一模型引入了 DeepSeek Sparse Attention(一種稀疏注意力機制),針對長文本的訓練和推理效率進行了探索性的優(yōu)化和驗證。

簡單來說,因為實現(xiàn)了細粒度稀疏注意力機制,在幾乎不影響模型輸出效果的前提下,可以實現(xiàn)長文本訓練和推理效率的大幅提升。

DeepSeek介紹,為了嚴謹?shù)卦u估引入稀疏注意力帶來的影響,團隊將 DeepSeek-V3.2-Exp 的訓練設置與 V3.1-Terminus 進行了嚴格的對齊。在各領域的公開評測集上,DeepSeek-V3.2-Exp 的表現(xiàn)與 V3.1-Terminus 基本持平。

目前,DeepSeek-V3.2-Exp 模型已在Huggingface與魔搭開源,官方App、網(wǎng)頁端、小程序均已同步更新為DeepSeek-V3.2-Exp。API 的模型版本已經更新為 DeepSeek-V3.2-Exp,訪問方式保持不變。

此外,為支持社區(qū)研究,DeepSeek 還開源了新模型研究中設計和實現(xiàn)的 GPU 算子,包括 TileLang 和 CUDA 兩種版本。團隊建議社區(qū)在進行研究性實驗時,優(yōu)先使用基于 TileLang 的版本,以便于調試和快速迭代。

值得一提的是,就在9月22日,DeepSeek才發(fā)布了DeepSeek-V3.1-Terminus模型,Terminus在拉丁語里是終點、界限的意思,當時業(yè)界猜測這是否會是V3系列的終極版本,并期待下一個發(fā)布的將是大版本更新,目前看起來這個猜測并不成立。

在年初海內外出圈后,DeepSeek每一次更新都成為業(yè)界矚目的焦點,但這幾個月以來DeepSeek幾次更新都是小版本的迭代,關于V4和R2的呼聲也越來越多。在DeepSeek這次 X平臺上的官宣帖子下,就有海外網(wǎng)友詢問“什么時候可以期待下一個V4和R2的版本”,很快有網(wǎng)友回復表示,結合這次發(fā)布來看近期并不會看到。

編 輯:高靖宇
飛象網(wǎng)版權及免責聲明:
1.本網(wǎng)刊載內容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦新聞              
 
人物
中國移動黃宇紅:量通智融合創(chuàng)新的探索、實踐與思考
精彩視頻
亨通光電精彩亮相2025通信展丨浸沒式液冷一體機 直擊高密度計算場景痛點
亨通數(shù)科精彩亮相2025通信展丨“工業(yè)互聯(lián)網(wǎng)+AI”智能制造解決方案 賦能行業(yè)數(shù)智化轉型
你少做,它多做,在2025驍龍峰會 中國站找尋下一場終端變革的神秘元素
中國信科集團精彩亮相2025通信展丨空天地一體,全域智聯(lián)未來
精彩專題
2025中國國際信息通信展覽會
中國信科精彩亮相2025中國國際信息通信展
第26屆中國國際光電博覽會
2025中國算力大會
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像