关闭广告

抢在GPT-5前升级模型,Anthropic发布Opus 4.1,编程、研究、数据分析更强大

华尔街见闻官方2025-08-06 12:00:022825人阅读

人工智能(AI)模型的竞赛再度升温。在OpenAI即将发布备受期待的GPT-5之际,Anthropic率先升级自家模型,推出Claude Opus 4.1,声称在编程、研究和数据分析能力方面实现显著提升。

美东时间8月5日周二,由前OpenAI员工创立的OpenAI劲敌Anthropic宣布,新模型Opus 4.1在编程评估基准SWE-Bench Verified上的得分达到74.5%,较前代Opus 4的72.5%提升两个百分点。

新模型在处理大型代码库导航和多文件代码重构方面表现尤为突出。GitHub、Rakuten Group等客户反馈显示,Opus 4.1在代码修改精准度和调试效率方面均有显著改善,能够在不引入漏洞的情况下精确定位需要修正的代码位置。

面对OpenAI本月可能发布GPT-5的竞争压力,Anthropic选择聚焦现有产品优化。

Anthropic的首席产品官Mike Krieger表示,此次Opus模型升级标志着公司战略转向更频繁的渐进式改进,而非仅专注重大版本更新。他说:

“过去,我们过于专注于只提供重要的升级。(模型)它现在在编码、推理和代理任务方面都更胜一筹。我们只是想让它更好地服务于人类。”

性能提升聚焦编程领域

Anthropic公布的数据显示,Opus 4.1在编程能力方面实现了实质性突破。

Anthropic公布,在评估大语言模型(LLM)完成现实世界软件工程能力的SWE-Bench Verified基准测试中,Opus 4.1取得74.5%的准确率。这一成绩相比Claude Sonnet 3.7的62.3%和Opus 4的72.5%有明显进步。


Anthropic强调,升级后的Opus模型在处理复杂多步骤问题时更加高效,定位为更有效的AI代理。新模型能够更好地导航大型代码库,在代码修改时更加精确。

Opus 4.1还“提升了Claude 的深入研究和数据分析能力,尤其是在细节追踪和代理搜索方面。”

Anthropic本周二表示,被Cognition收购的AI编程助手Windsurf反馈称,Opus 4.1在其初级开发人员基准测试中较Opus 4有一个标准差的改进,性能提升幅度相当于从Sonnet 3.7跃升至Sonnet 4的水平。

客户反馈验证实用价值

Anthropic本周二提到一些企业客户的使用反馈,它们证实了新模型的实际改进效果。

比如日本电商巨头乐天集团(Rakuten Group)发现,Opus 4.1擅长在大型代码库中精确定位需要修正的位置,无需进行不必要的调整或引入漏洞,乐天的团队倾向于利用该模型的这种精确性处理日常调试任务。

Windsurf表示,使用Opus 4.1后编程任务完成速度更快,质量也有所提高。GitHub则指出,Opus 4.1相对于Opus 4在大多数功能上都有改进,在多文件代码重构方面的性能提升尤为显著。

市场竞争加剧背景下的战略调整

Anthropic此次发布正值AI行业竞争白热化之际。谷歌和OpenAI都推出了帮助程序员简化代码编写和调试流程的功能,而OpenAI高管也在公开场合为即将发布的GPT-5造势,有报道称该产品可能在本月推出。

被问及OpenAI即将发布的产品时,Mike Krieger表示:"我学到的一点是,我们要专注于自己拥有的东西,尤其是在快速发展的AI领域,其他人要做什么最终取决于他们自己。"

Anthropic本周二表示,Opus 4.1现已向付费Claude用户开放,并可通过Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI获得,定价与Opus 4保持一致。Anthropic还计划,未来几周内发布更重大的模型更新。

Anthropic被传新融资或推升估值至1700亿美元

将近两周前,7月中旬媒体称,Anthropic称其年化收入今年上半年增长四倍,已超过40亿美元,其爆炸式的收入增长引起部分投资者浓厚兴趣,考虑以超过1000亿美元的估值进行新一轮投资,较四个月前该司宣布融资时的580亿美元估值几乎翻了一番。

此后,有媒体在与多位中东投资者交流后表示,Anthropic即将到来的估值更接近1500亿美元。

上周又有媒体称,Anthropic正进行Iconiq Capital主导的新一轮融资相关磋商,拟融资30亿至50亿美元,使公司估值达到1700亿美元。另有媒体称,到7月末,Anthropic的年化收入已增至约50亿美元。该司预计,到今年年底,其经常性收入可能达到90亿美元。

Anthropic的新融资消息凸显了市场对头部AI公司未来增长的极高预期,尤其是对Anthropic在AI编码这一应用领域的强大变现能力方面。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特斯拉申报Model Y长续航后驱版 又是一个走量款

网易汽车 浏览 43 10-12

消息称高通将旗舰芯片转向 Arm 新架构,与苹果、联发科竞争加剧

IT之家 浏览 83 10-02

加快核反应堆测试 美总统签署有关核能发展行政命令

新京报 浏览 5281 05-25

穆里尼奥明确回应重返皇马传闻:别把我算进这场肥皂剧里

懂球帝 浏览 8 01-19

未来智能完成亿元级A轮融资,蚂蚁集团领投、启明创投超额跟投

雷科技 浏览 73 10-13

库克在全体员工大会上发表讲话 透露人工智能领域进展

威锋网 浏览 4070 08-03

朱媛媛离世2月,蒋勤勤仍泪崩:她咳到厉害还说吃火锅,瞒了5年

娱乐白名单 浏览 2274 08-08

26岁券商分析师转行 自称"上海链家最高学历拥有者"

中国基金报 浏览 136 08-25

11国将承认巴勒斯坦国之际 美国追加60亿美元对以军售

界面新闻 浏览 131 09-22

“江西水王”老婆自曝家丑:卖水可挣钱了,老公4婚5娃

说财猫 浏览 7547 07-23

首夺夏联冠军!黄蜂拒绝国王18分逆转 新科4号秀21分获FMVP

醉卧浮生 浏览 6738 07-22

意外去世,破产重组,宁波老厂长的悲歌

诗与星空 浏览 73 10-13

《庆余年》第三季大结局

草莓解说体育 浏览 102 09-20

“外卖大战 配送慢”上热搜,“15分钟达”订单最终可能要30多分钟?

第一财经资讯 浏览 5220 08-19

曹西平告别葬礼举行,灵堂布置很温馨,小S送花篮哀悼

素素娱乐 浏览 4 01-27

欧文:我不会批评伊萨克,球员短暂的职业生涯中机会很难得

懂球帝 浏览 72 08-22

张泉灵硬核督战,CEO当场跑路,万千惠真的被做局了?

仙女事件簿 浏览 55 09-22

《东极岛》全网捂嘴惹众怒,律师直接硬刚片方:拿名誉权做牌坊

萌神木木 浏览 647 08-13

不出意外霍启山很难结婚不是因为他遇到自己

科学发掘 浏览 23 12-21

WAIC前线|阿里国际AI解决方案Marco获世界人工智能大会SAIL之星

网易科技报道 浏览 453 07-27

欧盟峰会与美俄乌磋商在即 被冻结俄资产成博弈焦点

北青网-北京青年报 浏览 33 12-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3