NVIDIA 攜手OpenAI 推出開源AI模型 gpt-oss
分類: 軟體 新品報導 8/6/2025
NVIDIA攜手OpenAI宣布推出全新開源AI模型「gpt-oss」,專為NVIDIA GPU最佳化,從雲端到個人電腦皆可快速且高效地執行推理任務。這些全新的推理模型可廣泛應用於網頁搜尋、深度研究等多樣化的AI應用場景。
隨著「gpt-oss-20b」與「gpt-oss-120b」的推出,OpenAI將前沿的AI模型技術開放給全球數百萬用戶,讓AI開發者與愛好者可透過NVIDIA RTX AI PC及工作站體驗優化後的AI模型。使用者可透過Ollama、llama.cpp與Microsoft AI Foundry Local等熱門工具及框架,輕鬆於配備NVIDIA GeForce RTX 5090 GPU的設備上,達到每秒高達256個tokens的運算效能。

NVIDIA創辦人暨執行長黃仁勳表示:「OpenAI曾向全球展示如何透過NVIDIA的AI技術創造出令人驚豔的成果,而現在他們更進一步推動開源軟體的創新。這些gpt-oss模型使全球開發者都能基於先進的開源基礎進行開發,強化美國在AI技術的領先地位,並充分利用全球最大的AI運算基礎設施。」
這次模型的發布也再次凸顯NVIDIA在AI領域從訓練到推理、從雲端到個人電腦的全面領先地位。
「gpt-oss-20b」與「gpt-oss-120b」兩個模型皆採用彈性的混合專家(mixture-of-experts)架構,具備鏈式思維推理能力,並支援指令執行與工具應用等多種功能。這些模型皆透過NVIDIA H100 GPU訓練,支援高達131,072的超長上下文(context length),可處理複雜的內容分析任務,例如網頁搜尋、程式編寫輔助、文件理解及深入研究。

值得一提的是,這些模型亦是首批支援MXFP4混合精度的開源模型,相較其他精度模型,MXFP4能夠提供更高效能、更高品質且更節省資源的運算。
若想在RTX AI PC上快速體驗gpt-oss模型,最簡單的方法就是透過新推出的Ollama應用程式。Ollama因其操作簡單、易於整合廣受使用者喜愛,且新版本的使用者介面已內建支援OpenAI開源模型,無需額外設定即可達到最佳效能。此外,Ollama還加入了對PDF、純文字檔案及多模態圖像內容的支援,提供更靈活的聊天與檔案互動。
除了Ollama外,AI開發者也能透過llama.cpp、GGML張量庫等其他工具體驗這些模型,NVIDIA也持續與開源社群合作,透過CUDA Graphs等技術降低運算負擔,提升在RTX GPU上的效能。
而微軟則透過Microsoft AI Foundry Local工具,讓Windows開發者可輕鬆執行gpt-oss模型。透過ONNX Runtime與CUDA最佳化技術,使用者僅需在終端機輸入簡單的指令,即可立即啟動模型,未來也將支援NVIDIA TensorRT技術。
這波開源模型的推出,將引領下一波AI應用創新的浪潮,推動AI技術更廣泛應用於Windows環境。NVIDIA也每週透過RTX AI Garage部落格系列,分享社群最新AI創新內容與NIM微服務、AI藍圖相關資訊,讓使用者進一步了解如何在個人AI電腦及工作站上建立智慧代理、創意工作流程及生產力應用。
使用者還可透過NVIDIA在Facebook、Instagram、TikTok、X及LinkedIn等社交平台掌握最新動態,並透過訂閱RTX AI PC電子報或加入NVIDIA官方Discord社群,與其他AI開發者及愛好者交流討論。