关闭广告

Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新

量子位2025-08-06 12:00:023256人阅读

明敏 发自 凹非寺
量子位 | 公众号 QbitAI

还是Claude痛快,Claude Opus 4.1前脚曝光,今天这就正式发了。

编程性能再次突破天花板,超越Claude Opus 4,拿下SOTA。

此外在Agent任务和推理方面进一步升级。

但加量不加价,定价和Claude Opus 4一样



官方说计划在未来几周对模型进行更大规模升级与改进,看来真就只是一次小更新,替代Opus 4。



实测用它做一个俄罗斯方块小游戏,提示词是“build the tetris game”,表现很稳。



有人觉得,Anthropic可能本来不想发模型,但是奈何GPT-5/Gemini-3的消息太多,为了保持市场竞争力所以先更新一波。



值得一提的是,Claude Opus 4.1这篇发布blog虽然简短,但是里面的心机可不老少——秀性能提升、秀客户关系、还变相证明自家模型真实好用。

现在的硅谷AI圈,真有意思哇。



明晒模型性能,暗秀客户关系

Anthropic首先晒了大家最关心的模型编程能力。

在SWE-bench上,Opus 4.1超越Opus 4、Gemini 2.5 Pro、o3,将性能提升至74.5%,拿下新SOTA。

同时还提升了深度研究和数据分析的技能,特别是在细节追踪和Agent检索方面。



其次,他们还找来客户做背书,邀请他们分享了内测中觉得Opus 4.1印象深刻的能力。既能体现自家模型在真实场景中好用,也暗暗秀了一把自己的客户订单。

根据GitHub给出的三方结果,Opus 4.1各个方面都较Opus 4有所改进,特别是在跨文件重构代码上,提升明显。

Rakuten Group(日本乐天株式会社)表示,Opus 4.1很擅长在大型代码库中精准定位、修复bug,且不需要进行不必要的调整、也不会产生新的bug,他们团队很喜欢在日常任务中使用这一功能。

Windsurf则表示,在初级开发基准测试中,Opus4到Opus 4.1的提升,和此前Sonnet 3.7到Sonnet 4的提升一样大。

这里插一句,因为亚历山大·王带团跳槽Meta,Windsurf剩余团队去向不明期间,Anthropic还断供了Windsurf一段时间,这应该是因为当时OpenAI要收购Windsurf。

如今随着Windsurf被Cognition收购,这种封锁已经解除,借着此次模型升级,Anthropic也算是亮明“大家还是好伙伴”的态度。



至于为啥找这么多客户来背书……前段时间GPT-5被泄露可不只有ChatGPT这边,还包括Cursor等合作平台,是故意的还是不小心不知道,但是OpenAI和谁合作大家都清楚了。Anthropic也想晒客户关系,也很正常。

最后,这篇Blog很简短,官方也明说就是小升级。

这种文风更受开发者们喜爱,毕竟隔壁的大忽悠实在是emmm……太能拉高大家预期了。



不管是有意还是无意,Anthropic都和最近一直炒GPT-5热度的OpenAI形成鲜明对比,谁现在更加技术本色,大家想必也心中有选择。

以及Opus 4.1的System Card也一同发布,其中表明Opus 4.1是对Opus 4的进一步调整,模型的核心尺寸或训练方法都没有变化

同时Anthropic也公布了Opus 4.1的更多相关指标。

比如Opus 4.1的无害回复回应率更高,如果开启推理,指标已经能达到99.06%。



更多内容大家可在System Card中进一步查看。

最后,Claude Opus 4.1已面向所有付费用户开放,包括Claude Code;也可以通过API、Amazon Bedrock和Vertex AI上使用,定价和Claude Opus 4一样。

Blog:https://www.anthropic.com/news/claude-opus-4-1
System Card:https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

波白边境口岸重开在即 中欧班列货代终于"松口气"

环球网资讯 浏览 106 09-25

韩国反华游行愈演愈烈 李在明一声不吭或缺席九三阅兵

掌青说历史 浏览 9352 07-20

MIT研发智能植入装置,可自动释放低血糖救命药物

网易科技报道 浏览 7616 07-23

苦等14年 50岁贝克汉姆获封英国王室最高爵士头衔

封面新闻 浏览 30 11-06

冯德莱恩刚到北京美国传出两个消息 特朗普向欧洲示好

掌青说历史 浏览 7781 07-25

“人血馒头吃不停”?张兰一反常态怀念大S

老吴教育课堂 浏览 8707 07-22

王牌90-88险胜水星,大比分3-0拿下赛点,阿贾-威尔逊砍34+14&绝杀

懂球帝 浏览 50 10-09

小鹏汇天“陆地航母”于迪拜完成公开飞行演示

网易汽车 浏览 59 10-13

AMD苏姿丰公开怼扎克伯格!反对1亿年薪挖人,使命感比钞票更重要

量子位 浏览 9171 08-19

当人类把经验与想象力交给机器人,具身智能如何承载新内容?

刺猬公社 浏览 7 01-27

MagicLink 推出“全球最快多卡同时读取”读卡器,119 美元

IT之家 浏览 5374 07-20

贾跃亭:FX Super One 车型在美国汉福德工厂试制顺利

IT之家 浏览 96 08-26

一审领刑12年 海航原董事长陈峰当庭表示上诉

经济观察报 浏览 529 07-20

【观察】一打强队就出问题,齐沃打硬仗还欠火候

体坛周报 浏览 40 11-27

满大街“露奶衫”?短上衣+高腰下装,才是今夏组合!

Yuki女人故事 浏览 1634 06-16

女友BELLA+封面 | aespa GISELLE: 以努力为名的青春

伊周潮流 浏览 42 10-25

曼联公布友谊赛vs利兹联大名单,多名梯队小将在列

懂球帝 浏览 5952 07-19

B站 App 海外上线“AI原声翻译功能”:提供画面/音频两大能力

IT之家 浏览 6908 08-04

鑫元基金,出了个年度“亏损王”

深蓝财经 浏览 12 01-07

你有没有发现 保时捷越来越像大众了?

网易汽车 浏览 78 10-28

恒丰银行重庆分行被罚260万元,3名责任人被警告

派财经 浏览 81 08-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3