阿里巴巴發布旗艦模型 Qwen3-Max-Thinking,於 HLE 基準測試中表現優於 GPT-5.2。其 Qwen 開源系列模型累計下載量已逾 10 億次,超越 Llama 系列,展現其於模型推理與開源生態的領導地位。阿里巴巴發布旗艦模型 Qwen3-Max-Thinking,於 HLE 基準測試中表現優於 GPT-5.2。其 Qwen 開源系列模型累計下載量已逾 10 億次,超越 Llama 系列,展現其於模型推理與開源生態的領導地位。

阿里巴巴推出通義千問 Qwen3-Max-Thinking HLE 評測超越 GPT 5.2

2026/01/27 16:28

阿里巴巴正式發布通義千問 Qwen3-Max-Thinking,其 HLE 基準測試成績超越 GPT 5.2,基於 Qwen 的衍生模型吸引累積下載破 10 億次,展現其在大模型競爭中的實力。
阿里巴巴稍早公布其迄今最強的旗艦推理模型「Qwen3-Max-Thinking」,這款參數規模突破萬億等級的巨獸,不僅宣稱在多項權威評測中擊敗OpenAI的GPT-5.2-Thinking與Google Gemini 3 Pro,更在被視為「人類最後測試」的HLE評測中創下全球最高分。

HLE評測狂勝10分,推理能力成最大亮點

Qwen3-Max-Thinking最大的賣點在於其強大的「深度推理」 (Reasoning)能力。根據阿里巴巴公佈數據,該模型使用多達36T Tokens規模的預訓練數據,並且在19項公認基準測試中表現優異。

其中最受矚目的是在HLE評測中,Qwen3-Max-Thinking拿下了58.3的高分,大幅領先GPT-5.2-Thinking (45.5 分)與Gemini 3 Pro (45.8 分)。在AI評測領域,超過10分的差距通常被視為「代際級」的領先,顯示其在解決複雜數學、邏輯與多步驟任務上的實力。

獨家「經驗提取」機制,讓AI越想越聰明

為什麼能這麼強?核心在於阿里採用的全新「測試時擴展」 (Test-time Scaling)機制。

不同於傳統方法只是單純增加推理路徑 (暴力窮舉),Qwen3-Max-Thinking導入「經驗提取」技術。它能識別、去除冗余的邏輯路徑,將算力集中在最有價值的思考分支上,不僅讓推理效率大幅提升,更降低企業應用成本。

此外,針對AI代理 (AI Agent)應用,新模型強化自主調用工具的能力,不再只是透過單純的對話互動,而是能主動判斷何時該聯網搜索、何時該寫程式碼或查閱知識庫,大幅降低模型「幻覺」問題。

超越Llama成為全球開源新霸主

除了技術突破,Qwen在開源生態的成績也相當驚人。根據Hugging Face數據,基於Qwen的衍生模型數量已突破20萬個,累計下載量超過10億次,日均下載量達110萬次。這意味著Qwen已經超越Meta的Llama系列,成為全球開發者首選的開源大模型基座。

目前,開發者已可在QwenChat上免費體驗Qwen3-Max-Thinking,企業用戶則可透過阿里雲百煉平台調用API。

分析觀點

Qwen3-Max-Thinking的出現,證明中國在「大模型推理」 (Reasoning Models)這條賽道上,已經具備與矽谷巨頭平起平坐、甚至超車的實力。

特別值得關注的是「測試時擴展」技術的應用。過去我們認為AI的能力主要取決於「預訓練」 (Pre-training)的規模,但現在戰場已經轉移到「推理時」 (Inference-time)的計算效率。

阿里巴巴透過最佳化思考路徑來提升效能,這對於商業落地來說至關重要,因為企業需要的是「既聰明又便宜」的AI,而不是只會燒錢的實驗品。

另一方面,Qwen在開源界的統治力,正在為阿里構建一道深不可測的護城河。當全球數百萬開發者都習慣使用Qwen架構開發應用時,這將反過來推動阿里雲的基礎設施成長。就像當年的Android一樣,誰掌握了開發者生態,誰就掌握AI時代的話語權。

資料來源

  • https://mashdigi.com/alibabas-qwen3-max-thinking-a-comprehensive-qa-platform-has-been-launched-its-hle-benchmark-surpasses-gpt-5-2-and-its-open-source-ecosystem-has-seen-over-1-billion-downloads/
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 service@support.mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡

機構現在控制近四分之一的可用 Bitcoin 供應量

機構現在控制近四分之一的可用 Bitcoin 供應量

這篇文章「機構現在控制了近四分之一的可用比特幣供應量」發表於 BitcoinEthereumNews.com。Bitcoin 2025年9月21日 | 11:00 (UTC +8) BitcoinTreasuries 的最新數據揭示了比特幣所有權在機構間的集中程度。根據數據顯示,約 3.74 百萬 BTC — 接近流通中所有幣的 18% — 現在掌握在公司、基金、政府和其他組織手中。最大份額屬於 ETF 和上市公司,自美國今年早些時候批准現貨比特幣 ETF 以來,它們迅速擴大了持有量。總共有 332 個實體已知持有儲備:192 家上市公司、44 個基金、68 家私人公司、13 個政府、11 個 DeFi 項目和 4 個主要託管人或交易所。 可用供應量的份額 當調整那些可能永遠不會流動的幣 — 包括估計由中本聰開採的 1.1 百萬 BTC 和高達 3.7 百萬被認為已丟失的幣 — 機構所有權代表了有效供應量的接近 23-25%。 全球分佈 美國領先,有 118 個實體報告持有比特幣儲備。加拿大次之,有 43 個,其次是英國(21)、日本(12)和香港(12)。這些國家共同主導了比特幣採用的機構格局,無論是通過企業財庫還是金融產品。 不斷增長的影響力 機構所有權的急劇增加與兩個趨勢相吻合:主要市場中受監管的 ETF 的出現,以及數字資產財庫公司的崛起,這些公司以與企業處理現金相同的方式管理加密貨幣儲備。這一轉變在 2025 年加速,進一步鞏固了比特幣作為全球金融中戰略資產的角色。 隨著近四分之一的流動供應量現在掌握在機構手中,比特幣的軌跡越來越與公司、基金甚至政府的策略相關聯 — 這引發了關於生態系統究竟有多去中心化的新問題。 本文提供的信息僅供教育目的使用...
分享
BitcoinEthereumNews2025/09/21 16:01
力成要進軍FOPLP 去年Q4三率三升EPS兩年高!

力成要進軍FOPLP 去年Q4三率三升EPS兩年高!

封測廠力成今(27)日舉辦法說會,公布第四季稅後淨利18.64億元,每股稅後盈餘為2.52元,創近兩年以來單季新高紀錄。同個場合,董事長蔡篤恭親自揭曉公司研發多年的扇出型面板級封裝已經準備好,可望在明年順利交付量產。搶攻AI商機,台灣封測廠力成正式宣布FOPLP已經Ready好了! 力成董事長 蔡篤恭:「總之這就是我
分享
Ustv2026/01/27 17:48
Valour 獲得 FCA 批准,在 LSE 推出 Bitcoin 和 Ethereum 質押 ETP

Valour 獲得 FCA 批准,在 LSE 推出 Bitcoin 和 Ethereum 質押 ETP

TLDR Valour 獲得 FCA 批准,在英國上市 Bitcoin 和 Ethereum 質押 ETP。英國散戶投資者透過 Valour ETP 獲得受監管的加密貨幣質押管道
分享
Coincentral2026/01/27 17:55