2025 年初,總部位於杭州的新創公司 DeepSeek(深度求索)發布了 R1 推理模型,其強大的效能與極高的運算效率震驚了全球投資者,甚至導致晶片巨頭 NVIDIA 遭遇了美國股市史上最大的單日市值損失 。如今,中國的開放權重模型(Open-weight models)已成為全球 AI 競爭中不可忽視的力量,甚至在2025 年初,總部位於杭州的新創公司 DeepSeek(深度求索)發布了 R1 推理模型,其強大的效能與極高的運算效率震驚了全球投資者,甚至導致晶片巨頭 NVIDIA 遭遇了美國股市史上最大的單日市值損失 。如今,中國的開放權重模型(Open-weight models)已成為全球 AI 競爭中不可忽視的力量,甚至在

中國 AI 開放模型逆襲!下載量超車美國,川普喊:「這是警鐘」

2025/12/25 17:03

在 2022 年底,中國的 AI 開發社群曾面臨前所未有的焦慮。當時,美國政府對半導體製造設備與高效能運算晶片實施了嚴厲的出口管制,緊接著 OpenAI 推出的 ChatGPT 又讓全球見識到了頂尖大型語言模型(LLM)的威力。當時的中國輿論紛紛自省:為什麼這項突破沒有發生在中國?面對美國的領先,中國開發者該如何競爭?

然而,僅僅過了兩年多,情況發生了劇烈變化。2025 年初,總部位於杭州的新創公司 DeepSeek(深度求索)發布了 R1 推理模型,其強大的效能與極高的運算效率震驚了全球投資者,甚至導致晶片巨頭 NVIDIA 遭遇了美國股市史上最大的單日市值損失。

如今,中國的開放權重模型(Open-weight models)已成為全球 AI 競爭中不可忽視的力量。史丹佛大學人本人工智慧研究中心(Human-Centered Artificial Intelligence, HAI)近日發布一項報告,研究中國開放權重 AI 生態系統在 2025 年的進展與影響。報告指出,中國的開放權重模型目前在全球範圍內極受歡迎,甚至在採用率與技術能力上已趕上或超越了許多全球競爭對手。

創紀錄的下載量與社群採用

根據該份報告,阿里巴巴的 Qwen 模型家族(通義千問)在 9 月已超越 Meta 的 Llama,成為 Hugging Face 上下載量最高的語言模型家族。

以開發者生態系來看,在 2024 年 8 月至 2025 年 8 月期間,中國開發者的模型下載量佔 Hugging Face 總下載量的 17.1%,超過了美國開發者的 15.8%。

截至 2025 年 9 月,Hugging Face 上 63% 的新微調或衍生模型是基於中國開發的基礎模型。其中,基於阿里巴巴模型的衍生模型數量甚至超過了 Google、Meta、Microsoft 和 OpenAI 衍生模型的總和。

更值得注意的是,如果只看開放模型,前 25 名中有 22 個來自五家中國實驗室,只有一個非中國模型——法國公司 Mistral 的產品——能躋身其中,且這 22 個中國模型的表現全部優於美國排名最高的開放模型(OpenAI 的 gpt-oss-120b)。

Photo Credit: HAI。

效率至上:在限制中磨練出的「省錢」技術

報告分析,中國模型之所以受到青睞,不僅僅是因為其性能出色,還包括以下幾項實務優勢。

首先,由於面臨晶片限制,中國開發者優先開發運算效率高的模型(如採用 Mixture of Experts,MoE 架構),這使得模型在較少運算資源下也能展現強大性能,降低了使用者的部署成本,且能在更基礎的硬體設備上運行。

再來,新一代模型如 Qwen3 和 DeepSeek R1 轉向使用 Apache 2.0 或 MIT 授權協議。這些協議極為寬鬆,允許開發者自由地進行商業使用、修改和再分發。

而在性能方面,在 Chatbot Arena 等基準測試中,中國開放模型(如 Z.ai 的 GLM-4.5、Moonshot AI 的 Kimi K2)的表現與美國頂尖的閉源系統(如 OpenAI 或 Google 的模型)旗鼓相當。

不只有 DeepSeek,「AI 六小虎」受矚目

雖然 DeepSeek 近來吸走了大部分媒體目光,但中國的 AI 生態系其實深度驚人 。除了阿里巴巴這類擁有強大雲端基礎設施、能提供各類尺寸與模態模型的科技巨頭外,還有一群被稱為「AI 獨角獸」(中國稱之「AI 六小虎」)的新創公司,例如: Z.ai(智譜)、Moonshot AI(月之暗面)、Minimax 與百川智能等,這些新創公司大多依賴於中國大型科技公司(如阿里巴巴、騰訊)的資助。

這些模型在性能測試(Benchmarks)中表現極為強勁。在知名的 Chatbot Arena 評測榜單中,截至 2025 年 12 月,中國模型如 Z.ai 的 GLM-4.6、Moonshot 的 Kimi-K2 等,與美國最頂尖的封閉式模型(如 Google DeepMind、OpenAI 的產品)幾乎平起平坐。

開發者發現,這些模型不僅性能「夠好」,且在程式碼撰寫、邏輯推理與多語言支持上各有專長,這也打破了「開源模型必然遜於閉源模型」的迷思。

對許多企業和開發者來說,如果一個可以自由下載、在地部署且成本更低的開放模型已經「夠好用了」,他們就沒有理由繼續依賴美國巨頭提供的封閉式 API。

中國正瞄準「全球南方」

中國政府對開源技術的長期支持也扮演了關鍵角色。早在 2017 年,中國政府便將「開源」視為國家創新戰略,目的在整合產官學資源以實現技術自主。而在國際外交上,中國政府也將開放原始碼視為與美國出口管制抗衡的工具,藉此打造「普惠 AI」的形象,並希望獲得東南亞、非洲等全球南方(Global South)國家的支持。

今年 7 月在上海舉辦的「世界 AI 大會」上,中國政府倡議成立「世界人工智慧合作組織」,並將總部設於上海。中國國務院總理李強在會上強調,AI 資源集中在少數國家與公司,應更加重視普及普惠,並說中國願提供國際社會更多「中國方案」、貢獻更多「中國智慧」。

儘管中國模型大受歡迎,但挑戰依然存在。美國政府的測試發現,DeepSeek 等模型在防範惡意指令(Jailbreaking)的表現上,平均而言比美國模型脆弱 12 倍 。

此外,雖然開放權重模型可以本地運行,但若使用者依賴中國廠商提供的 API 或雲端服務,仍可能面臨數據傳輸回中國的風險,或是受到中國政府政治審查與宣傳的影響。

不過,這種「中國模式」已徹底改變了競爭賽道。DeepSeek R1 的成功被現任美國總統川普稱為「警鐘」,促使美國政府調整政策,將開放權重模型視為戰略資產。OpenAI 也在 2025 年 8 月打破多年慣例,重新釋出了兩款開放權重模型以維持競爭力。

對開發者而言,這或許是一個最好的時代,因為他們擁有了前所未有的選擇權;而對全球決策者來說,如何理解並應對這股由中國帶動的 AI 開放浪潮,將是未來十年最重要的科技課題。

加入 INSIDE 會員,獨享 INSIDE 科技趨勢電子報,點擊立刻成為會員

延伸閱讀:

  • 春節大紅包?NVIDIA 傳將出貨 H200 給中國規模達 8 萬顆
  • 中國 GPU「四小龍」齊聚資本市場!壁仞科技赴港 IPO 募資 6.23 億美元
  • 挖角 ASML 老將、用假身分掩護 華為領軍中國版「曼哈頓計畫」打造 EUV 設備甩開美國
市場機遇
Sleepless AI 圖標
Sleepless AI實時價格 (AI)
$0.03872
$0.03872$0.03872
+1.07%
USD
Sleepless AI (AI) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 service@support.mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。