Claude Opus 4.7正式发布编程、金融、多模态全面升级

2026-04-17 09:40:02 来源：新经网作者：冯思韵

很多朋友不知道【Claude Opus 4.7正式发布编程、金融、多模态全面升级】，今天小绿就为大家解答一下。

　　在软件工程领域，Opus 4.7取得了最突出的进步。在业界公认最硬核的SWE-bench Pro基准测试上，Opus 4.7从前代的53.4%跃升至64.3%，单代升级提升近11个百分点，大幅领先GPT-5.4（57.7%）和Gemini 3.1 Pro（54.2%）。在SWE-bench Verified上更是达到87.6%，CursorBench也从58%升至70%。

　　在实际应用层面，Opus 4.7可放心交付最复杂编码任务，能自行设计验证机制检查输出结果。Claude Code新增自动化Routines功能，支持定时/API/GitHub触发，合上电脑也能7×24小时运行，其年化营收已达25亿美元。

Clude

　　但也并非全面领先——Agentic search评测BrowseComp从前代的83.7%降至79.3%，被GPT-5.4（89.3%）和Gemini（85.9%）反超。整体而言，在直接可比基准上Opus 4.7仅以7比4的优势领先GPT-5.4，各实验室差距正在迅速缩小。值得注意的是，Opus 4.7并非Anthropic最强模型——Claude Mythos Preview仍因安全顾虑被限制使用，Opus 4.7与其存在全方位能力差距。

　　在多项基准测试中，Opus 4.7超越了GPT-5.4和Gemini 3.1 Pro：金融分析代理测试取得全球最高分；工具调用规模化评测MCP-Atlas达77.3%，超GPT-5.4的68.1%和Gemini的73.9%；法律AI平台Harvey的BigLaw基准上拿下90.9%；多步智能体推理提升14%，工具错误减少三分之一。

　　金融分析方面，它能生成严谨分析与建模、专业报告展示，任务间整合更紧密。视觉多模态支持边长最大2576像素的图像（约3.75百万像素，是前代三倍多），可解读密集截图、复杂图表和界面布局，官方称其更有“品味”且更具创造力。此外，模型能跨会话记住关键信息并复用于新任务，减少前置上下文，并引入新护栏，自动检测并拦截高风险网络安全请求。

　　【CNMO科技消息】近日，Anthropic正式发布Claude Opus 4.7，距上一次Opus 4.6发布仅间隔两个月，延续了每两个月一次的稳定迭代节奏。

　　Anthropic称，这是首个能自主通过“隐含需求测试”的Claude模型——模型需自行推断所需工具或行动，而非被明确告知。早期测试中，它甚至能反驳用户，拒绝盲从错误指令，早期用户评价其“感觉像一个更好的同事”。

以上问题已经回答了。如果你想了解更多，请关新经网网站 (https://www.xinhuatone.com/)

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

相关推荐

苹果引入Anthropic开发的Claude AI系统 欲放弃自研？

苹果引入Anthropic开发的Claude AI系统欲放弃自研？