关闭广告

抢在GPT-5前升级模型,Anthropic发布Opus 4.1,编程、研究、数据分析更强大

华尔街见闻官方2025-08-06 12:00:022893人阅读

人工智能(AI)模型的竞赛再度升温。在OpenAI即将发布备受期待的GPT-5之际,Anthropic率先升级自家模型,推出Claude Opus 4.1,声称在编程、研究和数据分析能力方面实现显著提升。

美东时间8月5日周二,由前OpenAI员工创立的OpenAI劲敌Anthropic宣布,新模型Opus 4.1在编程评估基准SWE-Bench Verified上的得分达到74.5%,较前代Opus 4的72.5%提升两个百分点。

新模型在处理大型代码库导航和多文件代码重构方面表现尤为突出。GitHub、Rakuten Group等客户反馈显示,Opus 4.1在代码修改精准度和调试效率方面均有显著改善,能够在不引入漏洞的情况下精确定位需要修正的代码位置。

面对OpenAI本月可能发布GPT-5的竞争压力,Anthropic选择聚焦现有产品优化。

Anthropic的首席产品官Mike Krieger表示,此次Opus模型升级标志着公司战略转向更频繁的渐进式改进,而非仅专注重大版本更新。他说:

“过去,我们过于专注于只提供重要的升级。(模型)它现在在编码、推理和代理任务方面都更胜一筹。我们只是想让它更好地服务于人类。”

性能提升聚焦编程领域

Anthropic公布的数据显示,Opus 4.1在编程能力方面实现了实质性突破。

Anthropic公布,在评估大语言模型(LLM)完成现实世界软件工程能力的SWE-Bench Verified基准测试中,Opus 4.1取得74.5%的准确率。这一成绩相比Claude Sonnet 3.7的62.3%和Opus 4的72.5%有明显进步。


Anthropic强调,升级后的Opus模型在处理复杂多步骤问题时更加高效,定位为更有效的AI代理。新模型能够更好地导航大型代码库,在代码修改时更加精确。

Opus 4.1还“提升了Claude 的深入研究和数据分析能力,尤其是在细节追踪和代理搜索方面。”

Anthropic本周二表示,被Cognition收购的AI编程助手Windsurf反馈称,Opus 4.1在其初级开发人员基准测试中较Opus 4有一个标准差的改进,性能提升幅度相当于从Sonnet 3.7跃升至Sonnet 4的水平。

客户反馈验证实用价值

Anthropic本周二提到一些企业客户的使用反馈,它们证实了新模型的实际改进效果。

比如日本电商巨头乐天集团(Rakuten Group)发现,Opus 4.1擅长在大型代码库中精确定位需要修正的位置,无需进行不必要的调整或引入漏洞,乐天的团队倾向于利用该模型的这种精确性处理日常调试任务。

Windsurf表示,使用Opus 4.1后编程任务完成速度更快,质量也有所提高。GitHub则指出,Opus 4.1相对于Opus 4在大多数功能上都有改进,在多文件代码重构方面的性能提升尤为显著。

市场竞争加剧背景下的战略调整

Anthropic此次发布正值AI行业竞争白热化之际。谷歌和OpenAI都推出了帮助程序员简化代码编写和调试流程的功能,而OpenAI高管也在公开场合为即将发布的GPT-5造势,有报道称该产品可能在本月推出。

被问及OpenAI即将发布的产品时,Mike Krieger表示:"我学到的一点是,我们要专注于自己拥有的东西,尤其是在快速发展的AI领域,其他人要做什么最终取决于他们自己。"

Anthropic本周二表示,Opus 4.1现已向付费Claude用户开放,并可通过Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI获得,定价与Opus 4保持一致。Anthropic还计划,未来几周内发布更重大的模型更新。

Anthropic被传新融资或推升估值至1700亿美元

将近两周前,7月中旬媒体称,Anthropic称其年化收入今年上半年增长四倍,已超过40亿美元,其爆炸式的收入增长引起部分投资者浓厚兴趣,考虑以超过1000亿美元的估值进行新一轮投资,较四个月前该司宣布融资时的580亿美元估值几乎翻了一番。

此后,有媒体在与多位中东投资者交流后表示,Anthropic即将到来的估值更接近1500亿美元。

上周又有媒体称,Anthropic正进行Iconiq Capital主导的新一轮融资相关磋商,拟融资30亿至50亿美元,使公司估值达到1700亿美元。另有媒体称,到7月末,Anthropic的年化收入已增至约50亿美元。该司预计,到今年年底,其经常性收入可能达到90亿美元。

Anthropic的新融资消息凸显了市场对头部AI公司未来增长的极高预期,尤其是对Anthropic在AI编码这一应用领域的强大变现能力方面。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

找回状态,李月汝替补出战17分钟砍8分7板1助1帽0失误,投篮5中4

懂球帝 浏览 3066 07-29

品质餐饮下半场,它正在被头部餐厅“翻牌子”

餐饮老板内参 浏览 9294 07-27

专为中国道路打造!宝马联合Momenta推出新一代智能驾驶系统

My车轱辘 浏览 9661 07-15

看了这么多穿搭才知道,这些造型最适合夏天,清凉耐看又舒适

静儿时尚达人 浏览 4743 07-01

记者:拜仁将就恩昆库提出永久转会报价 国米纽卡也在竞争

直播吧 浏览 7086 08-19

抓“朋友”?博主直播提SU7 Ultra,交付主管竟直接报警

三言科技 浏览 3450 08-18

轻熟女人看看这些夏季穿搭,从中找到适合的方案,减龄不老气

静儿时尚达人 浏览 6957 07-26

一家6口吃皮蛋4人中毒 其中2人危急做血液透析

红星新闻 浏览 204 10-10

欧盟调整“禁燃”,堵死自己的路

汽车公社 浏览 100 12-18

给《树影迷宫》演技最好的7位演员排座次:刘琳第3,第1无法超越

娱乐圈笔娱君 浏览 116 11-05

韩磊起诉后,女方公开道歉

未曾青梅 浏览 149 08-31

5人从越缅走私3万多只冻鸭制作酱板鸭 员工:鸭子很脏

红星新闻 浏览 2448 07-21

秦岚现身香港机场被偶遇,素颜皮肤白皙

胖子的勇气 浏览 83 01-21

聚焦AI,深圳国际电子展暨嵌入式展elexcon开幕

第一财经资讯 浏览 165 08-27

莱因克尔:曼联确实需要巴莱巴,不过新赛季他们也最多排中游

懂球帝 浏览 6926 08-12

智元新一代机器人精灵G2已获数亿元订单,并开启首批商用交付

财闻 浏览 65 10-16

上年纪的女人,夏天的“裙子”别瞎穿,记住这三点才优雅得体

静儿时尚达人 浏览 9375 07-25

中国为何倡导AI全球共建共治?|聚焦世界人工智能大会

国际金融报 浏览 8647 07-29

今年夏天流行的“多巴胺运动鞋”太时髦了,谁穿谁好看!

LinkFashion 浏览 1291 07-17

美国或将购买经“战场检验”的乌克兰无人机

环球网资讯 浏览 771 07-18

划重点!金融支持新型工业化,七部门重磅发文!

中国商报 浏览 7290 08-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3