摘要；

Anthropic推出了Claude Sonnet 4.5，能够执行代码并创建电子表格和幻灯片等文件。

该模型在AI编码基准测试中领先，在SWE-bench Verified和OSWorld性能测试中超越竞争对手。

开发者获得了新工具，包括检查点、更新的终端界面和Visual Studio Code扩展。

安全升级和30小时自主运行时间使Claude在企业级工作流程中更具弹性。

Anthropic正式推出了Claude Sonnet 4.5，这是其最新的大型语言模型，引入了一系列增强功能，使AI系统超越了传统的基于文本的交互。

凭借执行代码、生成文件和支持更长上下文编辑的能力，此次更新巩固了Claude作为企业和开发者实用工具的地位。

这家由亚马逊支持的AI初创公司，目前估值1830亿美元，将Claude的最新版本定位为将人工智能转变为真正数字同事的一步。该模型已经因在全球基准测试中名列前茅而受到关注，包括用于编码性能的SWE-bench Verified和软件可用性的OSWorld，得分达到行业领先的61.4%。

代码执行和文件创建

最突出的升级之一是Claude能够在对话中直接运行代码。这一功能允许用户排除故障、测试解决方案和完善算法，而无需离开聊天界面。

除了仅仅建议代码外，Claude现在可以主动展示功能，为开发者节省无数时间。

该模型还可以即时创建文件，从电子表格到幻灯片演示文稿。这一能力将Claude从纯粹的对话助手转变为能够贡献实际工作成果的实践合作者。企业可以利用这一功能简化重复性文档工作或自动化基本报告任务。

更智能的开发者工具

Anthropic进一步扩展了Claude Code，这是AI的专业编程助手。升级后的系统引入了允许开发者保存进度的检查点、重新设计的终端界面和原生Visual Studio Code扩展。

这种集成意味着程序员可以在他们日常使用的环境中与Claude无缝协作。

还添加了记忆工具，使Claude能够在复杂工作流程中保持上下文。这对于需要处理多个文件、跟踪修订或跟上大规模调试的长期项目特别有用。

安全性、持久性和行业影响

安全性一直是AI采用的障碍，Anthropic声称Claude Sonnet 4.5代表了迄今为止最可靠的模型。该公司减少了欺骗性或操纵性输出的实例，同时增强了对提示注入攻击的抵抗力，这种攻击中恶意指令可能导致模型泄露敏感数据。

该模型的自主运行时间从Claude Opus 4的七小时增加到令人印象深刻的30小时，使其能够在不失去跟踪的情况下专注于多步骤任务。这种耐力使Claude更适合金融、研究和网络安全领域的企业级工作负载。

行业分析师认为，此次发布是对2025年8月推出的OpenAI的GPT-5竞争的直接回应。虽然OpenAI在平衡创新与用户稳定性方面面临挑战，但Anthropic正将Claude定位为更可靠和"同事般"的伙伴，而不仅仅是一个聊天机器人。

文章《Anthropic通过代码执行、文件创建功能扩展Claude》首次发表于CoinCentral。