Anthropic 推出 Claude Opus 4.8,程式碼代理能力大幅進化



AI 公司 Anthropic 今日正式推出最新旗艦模型 Claude Opus 4.8,在代理式程式設計(agentic coding)、多領域推理與電腦操作等任務上都有明顯進步,被視為目前最強的「AI 程式設計協作者」之一。根據官方測試數據,Opus 4.8 在 SWE-Bench Pro 基準測試中達到 69.2% 的成績,超越 OpenAI 的 GPT-5.5 與 Google 的 Gemini 3.1 Pro。在多項代理式任務與知識工作評測中,也展現出更可靠的判斷力與執行力。


速度更快、成本更低

這次更新最受開發者關注的是「快速模式」(Fast Mode)。Opus 4.8 的快速模式速度比前一代快 2.5 倍,價格則便宜 3 倍。同時,模型在程式碼審查時「放過有缺陷程式碼」的機率,比 Opus 4.7 減少了 4 倍,顯示其判斷力與誠實度都有提升。

Anthropic 表示,Opus 4.8 在對齊(alignment)評測中也表現更好,較少出現欺騙或不當行為,親社會傾向更明顯。


新增「動態工作流」功能

此次更新還加入了「動態工作流」(Dynamic Workflows)研究預覽功能。開發者可以讓 Claude 拆解大型任務,自動規劃並啟動多個子代理(subagents)平行作業,適合進行大規模程式碼重構或專案遷移。目前這項功能已開放給 Enterprise、Team 與 Max 方案的 Claude Code 使用者。

此外,模型新增「努力程度控制」(Effort Control),讓用戶可以調整 Claude 思考的深度,預設為高努力模式以獲得最佳品質。Messages API 也支援在對話中途更新系統指令,方便開發者進行更彈性的控制。

AI 軍備競賽持續升溫

Anthropic 目前正同步開發比 Opus 系列更強大的新一代模型,並持續強化安全機制。據悉,代號「Claude Mythos」的新模型已在部分機構進行測試,預計不久後將開放給所有客戶使用。 隨著 Claude Opus 4.8 的推出,AI 在程式設計與代理任務上的實用性再次往前推進一大步。開發者與企業用戶可立即在 Anthropic 平台上體驗新模型。接下來就看看 OpenAI 甚麼時候要發布 GPT 5.6 了!


相關文章:

美國政府對 Anthropic Claude 祭出出口管制始末  [6/14/2026]
美國商務部祭管制 Anthropic 兩旗艦模型 Claude Fable 5 與 Mythos 5  [6/13/2026]
Anthropic 推出 Claude Fable 5 與 Mythos 5,Fable 5 成最強  [6/10/2026]
Anthropic 研究警示:LLM 將 N-day 漏洞利用開發縮短至數小時  [6/9/2026]
Anthropic 重磅報告呼籲建立全球可驗證暫停機制  [6/6/2026]
[「擇法善思林之蘭室藏津」的緣起]
高、低血糖都傷腦! 腦細胞「缺電」失智風險增72%
假冒「美國製造」!美國下架22項中國產品 FBI介入調查
獨家》這些人都是安全系統監控對象 美關注國民黨與陳恒往來
加味菸禁用持續卡關 國健署:仍在行政程序中
中職》天公不作美!洲際中信兄弟對樂天桃猿因雨延賽
自然組錄取率達94%? 警專:整體錄取率48%、落實汰劣把關素質
金門首例!擴大「預防性羈押」 毒駕累犯聲押獲准
中職》障礙不只600萬簽約金 吉力吉撈更為二軍底薪抱不平
教育部助校園建構完善教學環境 3年投入逾3億整修64校游泳池
台灣匹克球迎新局 新任理事長楊哲明捐200萬推動發展
WTT挑戰賽》連退兩名中國新星 安宰賢決賽和林鐘勳上演南韓內戰
才搬夏威夷展開新人生 黃大煒辭世 呂文婉一段話逼哭網友
誤認情敵狂追車還斜插擋去路 台中吃醋男搞烏龍遭送辦
中職》布雷克屢屢「問天」 餅總說明那個失落感
蔣萬安喊廢監院 沈伯洋反問:藍委為何屢拿監院報告質詢
[擇法善思林之蘭室藏津]