DeepSeek繼2025年1月20日發(fā)布DeepSeek-R1引發(fā)業(yè)內(nèi)對開源AI的廣泛關注和熱烈討論后,又將2月最后一周作為開源周“連放大招”,公開V3/R1的核心代碼和系統(tǒng)架構等重磅內(nèi)容。在全球開發(fā)者驚嘆并對DeepSeek下一代模型充滿期待的同時,業(yè)界也出現(xiàn)了對開源AI如何保持競爭力、如何推進商業(yè)化等的擔憂或質(zhì)疑。本文嘗試通過理清與分析開源AI的定義、意義和商業(yè)模式等,解答上述問題。
開源AI定義與DeepSeek開放程度
AI模型有別于傳統(tǒng)軟件,其不僅包括代碼,還涉及數(shù)據(jù)、參數(shù)和權重等,因此開源AI的定義并不像開源軟件般清晰,目前尚未形成統(tǒng)一認知。不過,LF AI&DATA 基金會1和開源倡議組織(OSI)2024年陸續(xù)提出了模型開放性框架(MOF)和開源AI定義(OSAID)1.0,為DeepSeek等是否屬于開源AI提供參考。
1.依據(jù)MOF,DeepSeek-V3/R1尚未達到最開放層級
模型開放性框架(MOF)由LF AI&DATA 基金會于2024年4月發(fā)布,用于客觀評估和分類機器學習模型的完整性和開放性。
MOF定義了Ⅲ、Ⅱ、Ⅰ等三個開放范圍逐步擴展的層級。Ⅲ級-開放模型要求開放模型架構、參數(shù)、技術報告等組件,幫助用戶使用、分析和構建模型,但限制了用戶對開發(fā)過程的深入了解。Ⅱ級-開放工具要求在Ⅲ級的基礎上,開放訓練和推理代碼等,幫助開發(fā)者更深入地理解模型工作原理,以及將模型部署至不同的環(huán)境和應用。Ⅰ級-開放科學要求在Ⅱ級的基礎上,開放數(shù)據(jù)集和研究論文等,確保研究者能夠完全訪問和復現(xiàn)AI模型的各個方面。目前,智源Aquila-VL-2B模型已通過MOF評估I級。
DeepSeek-V3/R1開放了模型參數(shù)、技術報告、部分訓練和推理代碼等,大致處于MOF的Ⅱ級,能夠良好地滿足使用者和開發(fā)者的需求,但距離“最開放”仍有空間。
表1 MOF分級與DeepSeek-V3/R1開放情況

注:根據(jù)公開信息整理,供參考。
2. 依據(jù)OSAID 1.0,DeepSeek-V3/R1尚不屬于開源AI
開源AI定義(OSAID)1.0是由OSI于2024年10月提出的全球首個開源AI標準,要求開源AI 必須提供完整的源代碼、模型參數(shù)信息和訓練數(shù)據(jù)信息等三個關鍵組成部分。其中,對于訓練數(shù)據(jù)信息,不要求提供數(shù)據(jù)集本身,但要求提供數(shù)據(jù)來源和出處、數(shù)據(jù)處理方法、如何獲取或許可這些數(shù)據(jù)以及確保具備相關技能的人能夠使用相同或類似的數(shù)據(jù)重建出實質(zhì)等效的系統(tǒng)。
同時,OSAID 1.0要求開源 AI 必須保證用戶擁有“可以出于任何目的使用該 AI 模型、無需征得許可即可修改模型、可以自由地研究系統(tǒng)的工作原理、可以自由分享和傳播”等四項權利。
根據(jù)上述定義,對于三個關鍵組成部分,DeepSeek-V3/R1已開放模型參數(shù)信息和核心代碼,基本未開放訓練數(shù)據(jù)信息,因此尚不能稱為開源AI。對于用戶權利,DeepSeek-R1代碼和模型開源采用“非常寬松”的MIT協(xié)議,允許用戶自由使用、修改、復制、分發(fā)和進行商業(yè)活動,滿足OSAID 1.0要求;DeepSeek-V3代碼開源采用MIT協(xié)議,模型開源采用基于OpenRAIL2自建的DeepSeek許可證,從負責任的角度會對用戶行為進行一定約束,或與“出于任何目的使用該 AI 模型”相悖。
此外,Llama、Stable Diffusion、Mistral等以開源宣傳自己的模型亦因未公開訓練數(shù)據(jù)信息、限制商業(yè)用途等被OSAID 1.0排除在開源AI之外。
開源AI意義與DeepSeek競爭力
盡管依據(jù)開源AI定義,DeepSeek不能算做完全意義上的開源,但從開發(fā)者與企業(yè)的實際反應來看,其已充分詮釋“以共享促創(chuàng)新”的開源精神,仍可視為現(xiàn)階段開源AI的代表。
1.開源是“做大蛋糕”的重要手段
高透明度且易于獲取的開源軟件有助于降低企業(yè)認知、采購、使用和管理IT技術的成本。根據(jù)交易成本理論,企業(yè)更傾向于選擇交易成本低的技術,為通過開源推進技術普及奠定了經(jīng)濟學基礎。DeepSeek迅速滲入金融、醫(yī)療、能源等各個行業(yè)的盛況,則充分證實了這項理論。因此,開源可帶動市場整體規(guī)模擴張,并讓貢獻者有機會分得更大蛋糕。
2.生態(tài)和信任是DeepSeek等開源AI的競爭力
DeepSeek開放模型參數(shù)與技術報告等后掀起全球復現(xiàn)熱潮,如伯克利團隊30美元成本復刻R1-Zero、港科大團隊使用8K樣本在7B模型上復刻R1/R1-Zero等,并均取得不俗效果,說明AI模型即使僅開放模型,已存在被迅速追平的可能,進一步開放代碼和數(shù)據(jù)等將削弱更多先發(fā)優(yōu)勢。
不過,開源從生態(tài)和信任等方面為貢獻者帶來新的競爭優(yōu)勢。一是可借助外部力量加速迭代與創(chuàng)新;二是有助于品牌傳播和形象提升,進而吸引更多用戶和人才,如微軟2014年起開源開發(fā)環(huán)境.NET“籠絡”開發(fā)者,為其云業(yè)務推廣創(chuàng)造有利條件;三是高透明度更易贏得市場信任,特別是AI大模型作為以數(shù)據(jù)驅(qū)動的復雜黑盒模型,安全問題是客戶主要顧慮之一,通過開源幫助客戶理解模型內(nèi)部機制可在一定程度上緩解擔憂。
開源AI商業(yè)模式
開源AI的商業(yè)模式與同樣推崇共享的互聯(lián)網(wǎng)類似,即流量變現(xiàn)。
1.產(chǎn)品層面的“流量變現(xiàn)”:以廣告和增值服務為主
廣告是開源項目獲取收入最直接的方式。知名開源前端框架Vue在官網(wǎng)、說明文檔和社交媒體賬號中為各級贊助商提供廣告位,贊助商級別越高,廣告位越醒目。如鉑金贊助商(2000美元/月)可獲Vue官網(wǎng)首頁和側邊欄、以及發(fā)布于GitHub的說明文檔中的明顯logo展示位;金牌贊助商(500美元/月)可獲Vue官網(wǎng)首頁和GitHub說明文檔中的大號logo展示位。
增值服務為開源項目提供更為豐富的變現(xiàn)方法。一是“+技術服務”。例如,紅帽贊助Linux操作系統(tǒng)開源項目fedora,并在fedora經(jīng)廣泛驗證后選取適合企業(yè)與商業(yè)用戶的部分附加技術支持形成商業(yè)版RHEL;谷歌開源容器管理工具Kubernetes后推出Kubernetes托管服務GKE;HuggingFace作為開源AI平臺,在免費提供模型和數(shù)據(jù)等的同時,也提供數(shù)據(jù)托管、API調(diào)用和模型定制等收費服務。二是“+付費組件”。例如,谷歌開源Android,但將Android與收取授權費用的谷歌移動服務(GMS)綁定。
目前,DeepSeek除了開源V3/R1等一系列模型,對V3/R1也按token消耗量收取API調(diào)用費,即已通過“+技術服務”變現(xiàn),未來可能拓展出廣告、會員、高級功能等更多收費方式。
2. 公司層面的“流量變現(xiàn)”:提高估值
隨AI模型逐漸成為新一代基礎軟件,其公司的估值方式可借鑒互聯(lián)網(wǎng)平臺公司,將用戶規(guī)模、用戶增速和獲客成本等作為核心依據(jù)。開源可有效促進用戶規(guī)模增長及獲客成本降低,進而提振估值。Databricks通過開源大數(shù)據(jù)處理引擎Spark迅速打響品牌,之后又陸續(xù)貢獻Delta Lake和MLflow等著名開源項目,2024年以620億美元的估值成為全球估值最高的非上市大數(shù)據(jù)公司;DeepSeek-R1開源并出圈后,DeepSeek公司估值中位數(shù)已達數(shù)百億美元,最高估值甚至達到1500億美元。
對運營商的建議
面向開源AI新趨勢,建議運營商主動擁抱,加強企業(yè)戰(zhàn)新規(guī)劃與開源的銜接,以重點專項為牽引,深化對開源AI的持續(xù)跟蹤,強化工具集研發(fā)、軟硬協(xié)同優(yōu)化等自主創(chuàng)新,細化標桿企業(yè)案例研究,如谷歌生來具備開源基因并持續(xù)貢獻、紅帽依托開源構筑商業(yè)閉環(huán)成長壯大、微軟及時調(diào)整“與開源為敵”的態(tài)度成功轉(zhuǎn)型等,探索與推進適合自身業(yè)務與能力的開源AI商業(yè)模式。