OpenAI 周二 (5 日) 正式發布兩款免費試用的開放權重語言模型:gpt-oss-120b 和 gpt-oss-20b。這是 OpenAI 自 2019 年推出 GPT-2 以來,六年來首次發布開放權重模型,同時也是其與微軟簽署獨家雲端服務協議後,首批問世的此類模型,代表 OpenAI 在 AI 戰略上邁出了重要一步。
此次發布的兩款新模型,旨在回應 Meta、微軟支持的 Mistral AI 以及中國新興力量 DeepSeek 等競爭對手在開放權重模型領域的挑戰。
OpenAI 執行長奧特曼表示:「gpt-oss 是一個重大突破,這是最先進的開放權重推理模型,具有與 o4-mini 相當的強大現實世界性能,可以在你自己的電腦(或手機的較小版本)上本地運行。我們相信這是世界上最好、最實用的開放模型。」
低成本、高效率的 GPT 模型選項
gpt-oss-120b 和 gpt-oss-20b 被設計為低成本的 GPT 模型選項,讓開發者、研究人員和企業能夠輕鬆運行和自訂。其中,gpt-oss-20b 可在 16GB 記憶體的筆記型電腦上運行,而 gpt-oss-120b 則需要約 80GB 記憶體,這兩款模型均支援高級推理、工具使用和思維鏈處理。
Altman 強調,這些模型可在個人電腦(PC)甚至手機上本地運行,無需網路連接,為用戶提供完全的控制權和隱私保護。這對於希望在本地環境中部署 AI 應用、確保數據安全和降低營運成本的用戶而言,無疑是巨大的利好。
值得一提的是,亞馬遜也宣布將首次在其 Bedrock 和 SageMaker 平台上提供 OpenAI 的開放權重模型,這是雲端運算巨頭亞馬遜首次引入 OpenAI 的產品,顯示了市場對開放權重模型的強烈需求和廣闊前景。
高度重視安全 測試與評估更廣泛
gpt-oss-20b 和 120b 的發布,凸顯著 OpenAI 戰略上的重要轉變。此前,OpenAI 曾多次推遲開放權重模型的發布,並進行了廣泛的安全測試和評估,以確保模型不被惡意利用。
所謂的「開放權重」是一種介於開源和閉源之間的中間形態,意味著企業和政府機構可以自主運行該模型,因為他們可以查看模型的權重並進行修改。這與完全開源(使用者可查看原始碼組成,包括訓練和權重分配方式)和完全閉源(模型內部機制不對外公開)有所不同。
OpenAI 對開放權重模型的安全性給予了特別關注。該公司在預訓練期間過濾了與化學、生物、放射性和核(CBRN)相關的有害數據。為直接評估風險,OpenAI 對模型進行了專門的生物學和網路安全資料微調,並與三個獨立專家小組合作,對其惡意微調評估提供回饋。Altman 強調:「我們努力減輕最嚴重的安全問題,特別是在生物安全方面。gpt-oss 模型在內部安全基準測試中的表現與我們的前端模型相當。」
超越與匹敵現有頂尖模型
根據 OpenAI 介紹,兩款 gpt-oss 模型採用了其最先進的預訓練和後訓練技術,特別注重推理、效率和跨部署環境的實用性。它們都使用了專家混合(MoE)架構的 Transformer,以減少處理輸入所需的活躍參數數量。
具體而言,gpt-oss-120b 每個 token 啟動 5.1 億參數,總參數量為 1170 億;gpt-oss-20b 活化 3.6B 參數,總參數量為 210 億。模型使用交替的密集和局部帶狀稀疏注意力模式,支援高達 128k 的上下文長度。
在效能評估方面,OpenAI 揭露,gpt-oss-120b 在核心推理基準測試中接近 OpenAI o4-mini 的表現。較小的 gpt-oss-20b 模型在相同評估中達到或超過 OpenAI o3-mini 的性能。
更令人振奮的是,gpt-oss-120b 在競賽編碼(Codeforces)、通用問題求解(MMLU 和 HLE)以及工具調用(TauBench)方面均優於 OpenAI o3-mini,並匹敵甚至超越了 OpenAI o4-mini。它在健康相關查詢(HealthBench)和競賽數學(AIME 2024 和 2025)方面的表現甚至超過 o4-mini。
即使規模較小,gpt-oss-20b 在上述同類的評估中也匹敵甚至超越了 OpenAI o3-mini,甚至在競賽數學和健康方面也超越了後者。
回應 Mea、DeepSeek 的挑戰
這兩款模型在 Apache 2.0 許可下免費提供,使用者可透過 Hugging Face 和 GitHub 等平台下載。除了亞馬遜,Baseten 和微軟也將提供這些模型。OpenAI 與包括 Azure、vLLM、Ollama、AWS、Fireworks 等領先部署平台合作,確保開發者能夠廣泛使用這些模型。微軟也將 GPU 優化版本的 gpt-oss-20b 模型引進 Windows 設備,讓 Windows 開發者更輕鬆地使用開放模型進行建置。
OpenAI 總裁 Greg Brockman 表示:「看到生態系統的發展令人興奮,我們很高興能為此做出貢獻,真正推動前端發展,然後看看會發生什麼。」此次發布開放權重模型,很大程度上受到市場競爭壓力驅動,特別是來自中國 DeepSeek 的挑戰。
為進一步推動開放 AI 的發展和安全,OpenAI 正在舉辦紅隊挑戰賽,獎金池為 50 萬美元,鼓勵全球研究人員、開發者和愛好者協助識別新的安全問題。Altman 表示:「我們相信這將帶來更多好處而非壞處,我們期待這一發布能夠實現新型研究並創造新型產品。」OpenAI 也與英偉達、AMD、Cerebras 和 Groq 等晶片製造商合作,確保模型在各種晶片上運作良好,共同推動開放 AI 的創新。
新聞來源 (不包括新聞圖片): 鉅亨網