Google 正式釋出 Gemma 4 12B-it 多模態模型適合本地部署



Google DeepMind 於 2026 年 6 月 3 日正式在 Hugging Face 釋出 Gemma 4 12B-it(Unified 版本),這是 Gemma 4 系列中備受期待的中型多模態模型。該模型採用 encoder-free(無編碼器)統一架構,能直接處理文字、圖像與音頻,具備 256K 超長上下文,並在多項基準測試中展現強勁實力,特別適合本地部署與開發者使用。


Gemma 4 12B-it 主要特色

  • 參數規模:11.95B(約 120 億)參數
  • 多模態能力:原生支援文字、圖像、音頻(Audio),可處理可變長寬比與解析度的圖像,以及音頻波形
  • 統一架構:捨棄傳統獨立編碼器,直接將圖像 patch 與音頻波形透過輕量線性層投影至模型嵌入空間,大幅降低延遲並提升整合性
  • 上下文長度:最高支援 256K tokens
  • 多語言支援:超過 140 種語言
  • 授權方式:Apache 2.0(商業友好)
根據官方基準測試,Gemma 4 12B-it 在多項重要評測中表現出色:
  • GPQA Diamond:78.8%
  • MMMU Pro(多模態推理):69.0%
  • LiveCodeBench v6(程式碼能力):72.0%
  • AIME 2026(數學):77.5%
  • 長上下文測試(128K 8-needle):43.4%
整體效能已逼近更大規模的模型,特別在程式碼生成與多模態理解上表現優異。

適合本地部署的設計
Gemma 4 12B 被定位為「工作站級」甜蜜點模型。量化後(Q4_K_M)檔案大小僅約 6.7 GB,適合具備 16GB 以上記憶體的筆電或工作站運行。這也讓它成為目前最強大的「可本地高效運行」的多模態開源模型之一。
使用方式

開發者可透過 Transformers 輕鬆載入:

from transformers import AutoProcessor, AutoModelForMultimodalLM 
model_id = "google/gemma-4-12B-it" 
processor = AutoProcessor.from_pretrained(model_id) 
model = AutoModelForMultimodalLM.from_pretrained(model_id, device_map="auto") 

目前已支援 Ollama、LM Studio 等本地工具,可快速體驗。

Gemma 4 12B-it 的推出,顯示 Google 持續推動開源多模態模型的民主化策略。它在效能、效率與易用性之間取得良好平衡,尤其適合開發者、研究人員與企業在本地環境部署多模態 AI 應用。


相關文章:

美軍「Maven計畫」使用 Grok 模型 輔助打擊伊朗行動  [6/17/2026]
Emergent.sh:AI 自主代理平台讓「非工程師」也能快速打造生產級應用程式  [6/17/2026]
Google 推出 DiffusionGemma 開放實驗模型,文字生成速度提升 4 倍  [6/14/2026]
《隨機鸚鵡的危險》論文與 Timnit Gebru 被 Google 解雇事件  [6/10/2026]
Google 推出 Agentic RAG 框架 提升企業 AI 回答準確度  [6/7/2026]
[「擇法善思林之蘭室藏津」的緣起]
PLG冠軍賽》盧峻翔26分聯手米爾納 領航猿擊敗勇士完成2連霸
拜遍全台苦無姻緣!日月潭月老助攻神速脫單結婚 男請戲班謝神
吳淑瑾代夫出戰澎湖縣長 陳光復兄弟姊妹發聲:全力支持
中職》「我能投大比賽」 伍鐸80勝有重要的訊息
邊吃美食邊看劇!北藝推「士林YES!」沉浸式戲劇 重回1990年代夜市風華
中職》味全選過3位高卒第一指名 葉總:劉基鴻有兌現狀元評價
30秒昏迷、5分鐘死亡!高大成解析軍人裸絞殺妻手法
優秀體育人才留不住?屏東新園國中排球隊僅2人留縣升學
WTT挑戰賽》讓2追3逆轉非洲天王 郭冠宏32強對決德國名將杜達
PLG冠軍賽》生涯最終賽季未捧冠 林志傑:遺憾無法完成團隊目標
胡瓜錄《下面一位》慘遭「顏面噴射」 破相傷勢曝光
毒駕跑不掉! 今晚起新北撒745警 街頭展開 「閉鎖式路檢」
中職》味全花4800萬很值得!朱育賢追平兄弟傳奇的大紀錄
喪屍煙彈檢驗量能超載!陳時中喊話:盼立院盡快通過預算
賴清德請習近平喝珍奶不是通敵?梁文傑回嗆:我很難理解你的問題
[擇法善思林之蘭室藏津]