從DeepSeek看，開源AI發(fā)展及商業(yè)化路徑

2025年3月7日 14:36 天翼智庫

DeepSeek繼2025年1月20日發(fā)布DeepSeek-R1引發(fā)業(yè)內(nèi)對開源AI的廣泛關注和熱烈討論后，又將2月最后一周作為開源周“連放大招”，公開V3/R1的核心代碼和系統(tǒng)架構等重磅內(nèi)容。在全球開發(fā)者驚嘆并對DeepSeek下一代模型充滿期待的同時，業(yè)界也出現(xiàn)了對開源AI如何保持競爭力、如何推進商業(yè)化等的擔憂或質(zhì)疑。本文嘗試通過理清與分析開源AI的定義、意義和商業(yè)模式等，解答上述問題。

開源AI定義與DeepSeek開放程度

AI模型有別于傳統(tǒng)軟件，其不僅包括代碼，還涉及數(shù)據(jù)、參數(shù)和權重等，因此開源AI的定義并不像開源軟件般清晰，目前尚未形成統(tǒng)一認知。不過，LF AI&DATA 基金會1和開源倡議組織（OSI）2024年陸續(xù)提出了模型開放性框架（MOF）和開源AI定義（OSAID）1.0，為DeepSeek等是否屬于開源AI提供參考。

1.依據(jù)MOF，DeepSeek-V3/R1尚未達到最開放層級

模型開放性框架（MOF）由LF AI&DATA 基金會于2024年4月發(fā)布，用于客觀評估和分類機器學習模型的完整性和開放性。

MOF定義了Ⅲ、Ⅱ、Ⅰ等三個開放范圍逐步擴展的層級。Ⅲ級-開放模型要求開放模型架構、參數(shù)、技術報告等組件，幫助用戶使用、分析和構建模型，但限制了用戶對開發(fā)過程的深入了解。Ⅱ級-開放工具要求在Ⅲ級的基礎上，開放訓練和推理代碼等，幫助開發(fā)者更深入地理解模型工作原理，以及將模型部署至不同的環(huán)境和應用。Ⅰ級-開放科學要求在Ⅱ級的基礎上，開放數(shù)據(jù)集和研究論文等，確保研究者能夠完全訪問和復現(xiàn)AI模型的各個方面。目前，智源Aquila-VL-2B模型已通過MOF評估I級。

DeepSeek-V3/R1開放了模型參數(shù)、技術報告、部分訓練和推理代碼等，大致處于MOF的Ⅱ級，能夠良好地滿足使用者和開發(fā)者的需求，但距離“最開放”仍有空間。

表1 MOF分級與DeepSeek-V3/R1開放情況

注：根據(jù)公開信息整理，供參考。

2. 依據(jù)OSAID 1.0，DeepSeek-V3/R1尚不屬于開源AI

開源AI定義（OSAID）1.0是由OSI于2024年10月提出的全球首個開源AI標準，要求開源AI 必須提供完整的源代碼、模型參數(shù)信息和訓練數(shù)據(jù)信息等三個關鍵組成部分。其中，對于訓練數(shù)據(jù)信息，不要求提供數(shù)據(jù)集本身，但要求提供數(shù)據(jù)來源和出處、數(shù)據(jù)處理方法、如何獲取或許可這些數(shù)據(jù)以及確保具備相關技能的人能夠使用相同或類似的數(shù)據(jù)重建出實質(zhì)等效的系統(tǒng)。

同時，OSAID 1.0要求開源 AI 必須保證用戶擁有“可以出于任何目的使用該 AI 模型、無需征得許可即可修改模型、可以自由地研究系統(tǒng)的工作原理、可以自由分享和傳播”等四項權利。

根據(jù)上述定義，對于三個關鍵組成部分，DeepSeek-V3/R1已開放模型參數(shù)信息和核心代碼，基本未開放訓練數(shù)據(jù)信息，因此尚不能稱為開源AI。對于用戶權利，DeepSeek-R1代碼和模型開源采用“非常寬松”的MIT協(xié)議，允許用戶自由使用、修改、復制、分發(fā)和進行商業(yè)活動，滿足OSAID 1.0要求；DeepSeek-V3代碼開源采用MIT協(xié)議，模型開源采用基于OpenRAIL2自建的DeepSeek許可證，從負責任的角度會對用戶行為進行一定約束，或與“出于任何目的使用該 AI 模型”相悖。

此外，Llama、Stable Diffusion、Mistral等以開源宣傳自己的模型亦因未公開訓練數(shù)據(jù)信息、限制商業(yè)用途等被OSAID 1.0排除在開源AI之外。

開源AI意義與DeepSeek競爭力

盡管依據(jù)開源AI定義，DeepSeek不能算做完全意義上的開源，但從開發(fā)者與企業(yè)的實際反應來看，其已充分詮釋“以共享促創(chuàng)新”的開源精神，仍可視為現(xiàn)階段開源AI的代表。

1.開源是“做大蛋糕”的重要手段

高透明度且易于獲取的開源軟件有助于降低企業(yè)認知、采購、使用和管理IT技術的成本。根據(jù)交易成本理論，企業(yè)更傾向于選擇交易成本低的技術，為通過開源推進技術普及奠定了經(jīng)濟學基礎。DeepSeek迅速滲入金融、醫(yī)療、能源等各個行業(yè)的盛況，則充分證實了這項理論。因此，開源可帶動市場整體規(guī)模擴張，并讓貢獻者有機會分得更大蛋糕。

2.生態(tài)和信任是DeepSeek等開源AI的競爭力

DeepSeek開放模型參數(shù)與技術報告等后掀起全球復現(xiàn)熱潮，如伯克利團隊30美元成本復刻R1-Zero、港科大團隊使用8K樣本在7B模型上復刻R1/R1-Zero等，并均取得不俗效果，說明AI模型即使僅開放模型，已存在被迅速追平的可能，進一步開放代碼和數(shù)據(jù)等將削弱更多先發(fā)優(yōu)勢。

不過，開源從生態(tài)和信任等方面為貢獻者帶來新的競爭優(yōu)勢。一是可借助外部力量加速迭代與創(chuàng)新；二是有助于品牌傳播和形象提升，進而吸引更多用戶和人才，如微軟2014年起開源開發(fā)環(huán)境.NET“籠絡”開發(fā)者，為其云業(yè)務推廣創(chuàng)造有利條件；三是高透明度更易贏得市場信任，特別是AI大模型作為以數(shù)據(jù)驅(qū)動的復雜黑盒模型，安全問題是客戶主要顧慮之一，通過開源幫助客戶理解模型內(nèi)部機制可在一定程度上緩解擔憂。

開源AI商業(yè)模式

開源AI的商業(yè)模式與同樣推崇共享的互聯(lián)網(wǎng)類似，即流量變現(xiàn)。

1.產(chǎn)品層面的“流量變現(xiàn)”：以廣告和增值服務為主

廣告是開源項目獲取收入最直接的方式。知名開源前端框架Vue在官網(wǎng)、說明文檔和社交媒體賬號中為各級贊助商提供廣告位，贊助商級別越高，廣告位越醒目。如鉑金贊助商（2000美元/月）可獲Vue官網(wǎng)首頁和側邊欄、以及發(fā)布于GitHub的說明文檔中的明顯logo展示位；金牌贊助商（500美元/月）可獲Vue官網(wǎng)首頁和GitHub說明文檔中的大號logo展示位。

增值服務為開源項目提供更為豐富的變現(xiàn)方法。一是“+技術服務”。例如，紅帽贊助Linux操作系統(tǒng)開源項目fedora，并在fedora經(jīng)廣泛驗證后選取適合企業(yè)與商業(yè)用戶的部分附加技術支持形成商業(yè)版RHEL；谷歌開源容器管理工具Kubernetes后推出Kubernetes托管服務GKE；HuggingFace作為開源AI平臺，在免費提供模型和數(shù)據(jù)等的同時，也提供數(shù)據(jù)托管、API調(diào)用和模型定制等收費服務。二是“+付費組件”。例如，谷歌開源Android，但將Android與收取授權費用的谷歌移動服務（GMS）綁定。

目前，DeepSeek除了開源V3/R1等一系列模型，對V3/R1也按token消耗量收取API調(diào)用費，即已通過“+技術服務”變現(xiàn)，未來可能拓展出廣告、會員、高級功能等更多收費方式。

2. 公司層面的“流量變現(xiàn)”：提高估值

隨AI模型逐漸成為新一代基礎軟件，其公司的估值方式可借鑒互聯(lián)網(wǎng)平臺公司，將用戶規(guī)模、用戶增速和獲客成本等作為核心依據(jù)。開源可有效促進用戶規(guī)模增長及獲客成本降低，進而提振估值。Databricks通過開源大數(shù)據(jù)處理引擎Spark迅速打響品牌，之后又陸續(xù)貢獻Delta Lake和MLflow等著名開源項目，2024年以620億美元的估值成為全球估值最高的非上市大數(shù)據(jù)公司；DeepSeek-R1開源并出圈后，DeepSeek公司估值中位數(shù)已達數(shù)百億美元，最高估值甚至達到1500億美元。

對運營商的建議

面向開源AI新趨勢，建議運營商主動擁抱，加強企業(yè)戰(zhàn)新規(guī)劃與開源的銜接，以重點專項為牽引，深化對開源AI的持續(xù)跟蹤，強化工具集研發(fā)、軟硬協(xié)同優(yōu)化等自主創(chuàng)新，細化標桿企業(yè)案例研究，如谷歌生來具備開源基因并持續(xù)貢獻、紅帽依托開源構筑商業(yè)閉環(huán)成長壯大、微軟及時調(diào)整“與開源為敵”的態(tài)度成功轉(zhuǎn)型等，探索與推進適合自身業(yè)務與能力的開源AI商業(yè)模式。

編輯：章芳

從DeepSeek看，開源AI發(fā)展及商業(yè)化路徑

從DeepSeek看，開源AI發(fā)展及商業(yè)化路徑