NVIDIA 發表 Nemotron 3 Super 開放模型,具備 1.2T 參數與 1M 詞元情境窗口。此模型為 Blackwell 最佳化,旨在解決代理型 AI 的「情境膨脹」與「思考稅」難題,支援複雜的多代理系統。NVIDIA 發表 Nemotron 3 Super 開放模型,具備 1.2T 參數與 1M 詞元情境窗口。此模型為 Blackwell 最佳化,旨在解決代理型 AI 的「情境膨脹」與「思考稅」難題,支援複雜的多代理系統。

NVIDIA 推出 Nemotron 3 Super 開放模型 破解代理型 AI 情境膨脹難題

2026/03/12 23:27
閱讀時長 9 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。

NVIDIA 發表專為代理型 AI 打造的 Nemotron 3 Super 開放模型,搭載 1200 億參數與 100 萬詞元超大情境窗口,針對 Blackwell 架構最佳化,可將資料輸送量提高 5 倍,精準解決複雜代理工作流程中的「情境膨脹」與「思考稅」難題。
隨著企業從單純的聊天機器人全面轉向「多代理系統」 (Multi-Agent Systems),底層AI模型正面臨著前所未有的效能與成本考驗。為了解決這些痛點,NVIDIA宣布推出全新的「Nemotron 3 Super」模型,這是一款具備1200億參數、採用混合專家 (MoE)架構的開放權重模型。透過提供高達100萬個詞元 (tokens)的超大情境窗口,以及針對NVIDIA次世代Blackwell架構運算平台深度最佳化,Nemotron 3 Super不僅可將資料輸送量提高5倍,更精準解決複雜代理工作流程中的「情境膨脹」與「思考稅」難題。

代理型AI的兩大緊箍咒:情境膨脹與思考稅

為何現有的大型語言模型 (LLM)難以勝任複雜的代理工作?NVIDIA點出企業目前遭遇的兩大發展瓶頸:

• 首先是「情境膨脹」。在多個AI代理協同工作的流程中,系統必須不斷在彼此之間傳遞完整的歷史紀錄、工具輸出結果與中間的推理過程。這導致產生的詞元數量往往是一般對話互動的15倍以上。龐大的資料量不僅讓運算成本飆升,更常導致AI在處理冗長任務時「失憶」或偏離原始目標。

• 其次是「思考稅」 (Thinking Tax)。一個稱職的自主代理,必須在執行任務的每一個步驟進行深度推理。但如果每一個微小的子任務都要呼叫一次千億參數級別的龐大模型,將導致應用程式運行極度緩慢且成本高昂,根本無法在企業環境中大規模落地。

混合架構發威:Mamba結合Transformer的極致效能

為了解決上述問題,Nemotron 3 Super帶來100萬詞元 (1M Tokens)的超大情境窗口,讓代理能將完整的工作流程狀態保留在記憶中。而在底層架構上,NVIDIA更是火力全開,導入了三大關鍵創新,使其相較前代模型在資料輸送量提升5倍的同時,更讓準確度提升2倍:

• 混合式架構 (Hybrid Architecture):破除單一架構的迷思,Nemotron 3 Super巧妙結合兩種神經網路。以Mamba層負責提供高達4倍的記憶體與運算效率 (尤其適合處理超長文本),並且搭配傳統的Transformer層驅動複雜的高階推理。

• 進階混合專家模型與潛在混合專家模型:雖然模型總參數高達1200億,但在推論階段,每次只會啟動120億個活躍參數,大幅降低運算負擔。更具突破性的是「潛在混合專家模型」 (Latent MoE)技術,能在推論時以「一個專家的運算成本,啟動四個專家模型」來預測下一個詞元,在不增加算力的前提下極致壓榨出更高的準確度。

• 多詞元預測 (Multi-Token Prediction): 打破過去一次只能吐出一個字的限制,模型能同步預測多個未來的詞元,讓整體推論速度直接飆升3倍。

針對Blackwell架構最佳化,全面開源力挺生態系

除了軟體架構的革新,Nemotron 3 Super更是NVIDIA針對Blackwell GPU平台量身打造的火力展示。在Blackwell架構運算平台上,該模型能以極低精度的NVFP4格式運行,使其推論速度可達上一代Hopper架構運算平台 (以FP8運行)的4倍之多,同時絲毫不犧牲準確度。

在開源態度方面,NVIDIA這次則顯得極度慷慨。Nemotron 3 Super不僅以寬鬆的授權方式釋放開放權重 (Open Weights),甚至連其超過10兆個詞元的訓練資料集、15個強化學習環境與完整的評估流程研究方法,都對外徹底公開。

目前,包含Perplexity、Amdocs、Palantir、達梭系統與西門子等業者,目前都已經開始佈署Nemotron 3 Super模型,藉此驅動內部軟體開發或垂直領域自動化代理。而企業開發者即日起則可透過build.nvidia.com、Hugging Face,或是Google Cloud、甲骨文、微軟Azure等各大公有雲平台存取這項NVIDIA NIM微服務。

分析觀點

Nemotron 3 Super的推出,再次證明NVIDIA並非只是一家「賣晶片的硬體公司」。

當OpenAI或Anthropic還在為閉源模型的訂閱費爭論不休時,NVIDIA選擇了一條截然不同的戰略:「把最強的軟體與模型免費送給你,只要你繼續買我的硬體」。

這次Nemotron 3 Super最可怕的地方在於其「完全針對NVIDIA自家硬體最佳化」的特性。透過「Mamba+Transformer」混合架構解決過往長文本的記憶體耗損問題,再用NVFP4精度綁定Blackwell GPU的算力優勢,NVIDIA實質上是為未來的「Agentic AI」 (代理型 AI)制定軟硬體一體化的標準規格。連高達10兆詞元的訓練資料集都全數公開,這無疑是對整個開源社群投下了一枚震撼彈,也將極大地加速企業級AI代理走出實驗室、投入實際產線的進程。

不過,真正殺招可能還是傳聞將在GTC 2026期間公布、主打企業級AI代理應用的NVIDIA版綠色龍蝦「NemoClaw」,其中可能打破硬體綁定,讓企業即便底層不是使用NVIDIA的專屬AI晶片,也能無縫接入。而此技術似乎已經開始向Salesforce、Cisco、Google、Adobe與CrowdStrike等企業軟體巨頭推廣,具體細節則預期會在GTC 2026期間揭曉。

資料來源

  • https://mashdigi.com/ending-context-inflation-and-thinking-tax-nvidia-unveils-nemotron-3-super-open-model-designed-specifically-for-agent-based-ai/
市場機遇
Ucan fix life in1day 圖標
Ucan fix life in1day實時價格 (1)
$0.0003842
$0.0003842$0.0003842
+1.39%
USD
Ucan fix life in1day (1) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡

2025 年的下一個 Bitcoin 故事

2025 年的下一個 Bitcoin 故事

這篇文章《2025年的下一個比特幣故事》發表於BitcoinEthereumNews.com。加密貨幣新聞 2025年9月18日 | 07:39(UTC +8)比特幣從模糊概念到全球資產的崛起是每位認真投資者仔細研究的教科書,而且故事還在繼續;比特幣現在交易價格已增加到115,000美元以上,提醒我們改變人生的行情往往在大多數人尚未關注時就已開始。T 懸在這個週期上的問題很簡單:新的競爭者能否在那些願意先行動的人的窗口仍然開放時,更快、更乾淨、更早地壓縮這個軌跡?仍在預售中的代幣是可以重複這個故事的代幣,而在這些代幣中,一個基於Ethereum的迷因幣吸引了最多的關注,因為它的團隊看起來決心在當今市場中產生影響,將文化與實用工具融合,設計旨在獎勵早期行動者而非後期追隨者。如果你正在尋找下一個不對稱機會,這裡就是動能與機制相遇的地方,這就是為什麼許多交易者悄悄地將這個特定的迷因幣標記為在擁擠市場中現在最值得購買的加密貨幣。在我們深入探討之前,讓我們快速回顧每個加密貨幣交易員都熟記於心的案例研究:比特幣如何從約0.0025美元增加到100,000美元以上,並將一個小眾實驗轉變為仍然為所有後來者設定標準的故事。比特幣2010-2025年價格歷史回到基本原則:一種奇怪的網路貨幣在2010年出現,然後一步步重新連接整個市場,比特幣從約0.0025美元增加到100,000美元以上的軌跡是每個交易台仍然引用的案例研究,因為它證明了一個代幣可以改變整個遊戲。2009年幾乎沒有人猜到目的地;比特幣於2009年1月3日推出,在2010年當披薩交易將BTC估值接近0.0025美元時獲得了價格信號,而早期交易所報價僅為幾分之...
分享
BitcoinEthereumNews2025/09/18 12:41
每個比特幣100萬美元?Bitwise首席投資長表示這不是「妄想者」的預測

每個比特幣100萬美元?Bitwise首席投資長表示這不是「妄想者」的預測

比特幣達到 100 萬美元?Bitwise 的 CIO 表示這不是「登月男孩」的預測一文首次出現在 BitcoinEthereumNews.com。比特幣達到 100 萬美元?Bitwise
分享
BitcoinEthereumNews2026/03/13 06:01
比特幣價格新聞轉為看跌,CryptoQuant牛市評分跌至100分中的10分,而Pepeto的300倍交易所預售每月支付1,741美元並從熊市中獲利

比特幣價格新聞轉為看跌,CryptoQuant牛市評分跌至100分中的10分,而Pepeto的300倍交易所預售每月支付1,741美元並從熊市中獲利

CryptoQuant的牛市指數已降至100分中的10分,確認Bitcoin深陷熊市區域,基本面疲弱且看漲前景有限
分享
Techbullion2026/03/13 06:02