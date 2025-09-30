摘要；

Anthropic 推出了 Claude Sonnet 4.5，能夠執行程式碼並創建電子表格和幻燈片等檔案。

該模型在 AI 編程基準測試中領先，在 SWE-bench Verified 和 OSWorld 性能測試中超越競爭對手。

開發者獲得了新工具，包括檢查點、更新的終端界面和 Visual Studio Code 擴展。

安全升級和 30 小時自主運行時間使 Claude 在企業級工作流程中更具彈性。

Anthropic 正式推出了其最新的大型語言模型 Claude Sonnet 4.5，引入了一系列增強功能，使 AI 系統超越了傳統的基於文本的互動。

憑藉執行程式碼、生成檔案和支持更長上下文編輯的能力，此次更新鞏固了 Claude 作為企業和開發者實用工具的地位。

這家由 Amazon 支持、目前估值達到 1830 億美元的 AI 初創公司，將 Claude 的最新版本定位為將人工智能轉變為真正數字同事的一步。該模型已經因在全球基準測試中名列前茅而受到關注，包括用於編程性能的 SWE-bench Verified 和用於軟件可用性的 OSWorld，得分達到了業界領先的 61.4%。

程式碼執行和檔案創建

最突出的升級之一是 Claude 能夠在對話中直接運行程式碼。這項功能允許用戶在不離開聊天界面的情況下排除問題、測試解決方案和優化算法。

除了僅僅建議程式碼外，Claude 現在可以主動展示功能，為開發者節省無數時間。

該模型還可以即時創建檔案，從電子表格到幻燈片演示文稿。這一能力將 Claude 從純粹的對話助手轉變為能夠貢獻實際工作成果的實踐合作者。企業可以利用這一功能簡化重複性文檔或自動化基本報告任務。

更智能的開發者工具

Anthropic 進一步擴展了 Claude Code，這是 AI 的專業編程助手。升級後的系統引入了允許開發者保存進度的檢查點、重新設計的終端界面和原生 Visual Studio Code 擴展。

這種整合意味著程序員可以在他們日常使用的環境中與 Claude 無縫協作。

系統還增加了記憶工具，使 Claude 能夠在複雜的工作流程中保持上下文。這對於需要處理多個檔案、跟踪修訂或跟上大規模調試的長期項目特別有用。

安全性、持久性和行業影響

安全性一直是 AI 採用的障礙，而 Anthropic 聲稱 Claude Sonnet 4.5 是其迄今為止最可靠的模型。該公司降低了欺騙性或操縱性輸出的實例，同時增加了對提示注入攻擊的抵抗力，這種攻擊中惡意指令可能導致模型洩露敏感數據。

該模型的自主運行時間已從 Claude Opus 4 的七小時增加到了令人印象深刻的 30 小時，使其能夠在不失去跟踪的情況下專注於多步驟任務。這種耐力使 Claude 更適合金融、研究和網絡安全領域的企業級工作負載。

行業分析師將此次發布視為對 OpenAI 的 GPT-5（於 2025 年 8 月推出）競爭的直接回應。雖然 OpenAI 在平衡創新與用戶穩定性方面面臨挑戰，但 Anthropic 正將 Claude 定位為更可靠的"同事式"合作夥伴，而不僅僅是一個聊天機器人。

