关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024815人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。









版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

向太曝郭碧婷父亲患病或时日无多,儿媳长期留台,私房钱贴补娘家

不八卦会死星人 浏览 15 10-14

黄奕带娃闯韩娱续集来了:一手好牌打稀烂

每日一见 浏览 2177 08-19

记者:国米在1月以630万欧从罗马引进扎莱夫斯基,如今1700万出售

直播吧 浏览 8160 08-18

快手Q2盈利创新高,业绩跑赢预期的快手该咋看?

江瀚视野 浏览 52 08-22

【产业互联网周报】 OpenAI推出GPT-5模型;OpenAI开源两款新模型;美国ITC正式对移动蜂窝通信设备启动337调查;阿里巴巴、腾讯开启2026届秋招

钛媒体APP 浏览 1471 08-11

梓渝劈腿曝光?本人发声道歉承认不成熟

萌神木木 浏览 6194 07-24

专家:美处理俄乌冲突陷两难 特朗普必须避免对俄示弱

齐鲁壹点 浏览 9240 08-05

外套里面穿什么?这4款内搭时髦又显瘦!

Yuki女人故事 浏览 35 09-25

天空:多特仍在推动签下桑乔,但尚未向曼联提交正式报价

懂球帝 浏览 2250 08-05

加沙民众讲述领援助时遭袭经历:冒死也得去

上观新闻 浏览 8923 08-08

消息称星闪将逐步规范能力分级,以区分不同等级芯片支持能力差异

IT之家 浏览 24 09-21

俄方:普京即将开启的访华之旅"史无前例"

参考消息 浏览 49 08-29

生于中国的美国研究员承认窃取美国商业机密 中方回应

外交部网站 浏览 8495 07-23

董璇给张维伊老家亲戚买金子,男方瞬间变脸,双方经济实力差太多

萌神木木 浏览 44 08-31

奥迪·上汽的422天,一场不妥协的新豪华实验

网易汽车 浏览 5143 07-23

克罗宁:看利拉德身穿别队球衣时 我总感觉不太对劲

直播吧 浏览 6746 07-22

零零科技预热全新 Hover Air 无人机,主打抗水防溅

IT之家 浏览 8103 08-05

消费降级2年,大家2025年还会买什么?

黎贝卡的异想世界 浏览 7 10-22

中国观众认定的烂片,北美观众当成宝,全球破6.9亿夺票房冠军

靠谱电影君 浏览 7506 08-17

《生万物》他:像河正宇不火 与殷桃分手后仍一人

侃人吃瓜记 浏览 43 08-31

6名学生浮选槽中遇难 专家:内有泡沫层 很难将头探出

红星新闻 浏览 264 07-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3