关闭广告

抢在GPT-5前升级模型,Anthropic发布Opus 4.1,编程、研究、数据分析更强大

华尔街见闻官方2025-08-06 12:00:022783人阅读

人工智能(AI)模型的竞赛再度升温。在OpenAI即将发布备受期待的GPT-5之际,Anthropic率先升级自家模型,推出Claude Opus 4.1,声称在编程、研究和数据分析能力方面实现显著提升。

美东时间8月5日周二,由前OpenAI员工创立的OpenAI劲敌Anthropic宣布,新模型Opus 4.1在编程评估基准SWE-Bench Verified上的得分达到74.5%,较前代Opus 4的72.5%提升两个百分点。

新模型在处理大型代码库导航和多文件代码重构方面表现尤为突出。GitHub、Rakuten Group等客户反馈显示,Opus 4.1在代码修改精准度和调试效率方面均有显著改善,能够在不引入漏洞的情况下精确定位需要修正的代码位置。

面对OpenAI本月可能发布GPT-5的竞争压力,Anthropic选择聚焦现有产品优化。

Anthropic的首席产品官Mike Krieger表示,此次Opus模型升级标志着公司战略转向更频繁的渐进式改进,而非仅专注重大版本更新。他说:

“过去,我们过于专注于只提供重要的升级。(模型)它现在在编码、推理和代理任务方面都更胜一筹。我们只是想让它更好地服务于人类。”

性能提升聚焦编程领域

Anthropic公布的数据显示,Opus 4.1在编程能力方面实现了实质性突破。

Anthropic公布,在评估大语言模型(LLM)完成现实世界软件工程能力的SWE-Bench Verified基准测试中,Opus 4.1取得74.5%的准确率。这一成绩相比Claude Sonnet 3.7的62.3%和Opus 4的72.5%有明显进步。


Anthropic强调,升级后的Opus模型在处理复杂多步骤问题时更加高效,定位为更有效的AI代理。新模型能够更好地导航大型代码库,在代码修改时更加精确。

Opus 4.1还“提升了Claude 的深入研究和数据分析能力,尤其是在细节追踪和代理搜索方面。”

Anthropic本周二表示,被Cognition收购的AI编程助手Windsurf反馈称,Opus 4.1在其初级开发人员基准测试中较Opus 4有一个标准差的改进,性能提升幅度相当于从Sonnet 3.7跃升至Sonnet 4的水平。

客户反馈验证实用价值

Anthropic本周二提到一些企业客户的使用反馈,它们证实了新模型的实际改进效果。

比如日本电商巨头乐天集团(Rakuten Group)发现,Opus 4.1擅长在大型代码库中精确定位需要修正的位置,无需进行不必要的调整或引入漏洞,乐天的团队倾向于利用该模型的这种精确性处理日常调试任务。

Windsurf表示,使用Opus 4.1后编程任务完成速度更快,质量也有所提高。GitHub则指出,Opus 4.1相对于Opus 4在大多数功能上都有改进,在多文件代码重构方面的性能提升尤为显著。

市场竞争加剧背景下的战略调整

Anthropic此次发布正值AI行业竞争白热化之际。谷歌和OpenAI都推出了帮助程序员简化代码编写和调试流程的功能,而OpenAI高管也在公开场合为即将发布的GPT-5造势,有报道称该产品可能在本月推出。

被问及OpenAI即将发布的产品时,Mike Krieger表示:"我学到的一点是,我们要专注于自己拥有的东西,尤其是在快速发展的AI领域,其他人要做什么最终取决于他们自己。"

Anthropic本周二表示,Opus 4.1现已向付费Claude用户开放,并可通过Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI获得,定价与Opus 4保持一致。Anthropic还计划,未来几周内发布更重大的模型更新。

Anthropic被传新融资或推升估值至1700亿美元

将近两周前,7月中旬媒体称,Anthropic称其年化收入今年上半年增长四倍,已超过40亿美元,其爆炸式的收入增长引起部分投资者浓厚兴趣,考虑以超过1000亿美元的估值进行新一轮投资,较四个月前该司宣布融资时的580亿美元估值几乎翻了一番。

此后,有媒体在与多位中东投资者交流后表示,Anthropic即将到来的估值更接近1500亿美元。

上周又有媒体称,Anthropic正进行Iconiq Capital主导的新一轮融资相关磋商,拟融资30亿至50亿美元,使公司估值达到1700亿美元。另有媒体称,到7月末,Anthropic的年化收入已增至约50亿美元。该司预计,到今年年底,其经常性收入可能达到90亿美元。

Anthropic的新融资消息凸显了市场对头部AI公司未来增长的极高预期,尤其是对Anthropic在AI编码这一应用领域的强大变现能力方面。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"85后"华裔美女开了一家咖啡馆 却意外成泰国总理夫人

上游新闻 浏览 37 09-21

杨瀚森不参加与委内瑞拉两场热身赛 月底打波黑两场也大概率不打

醉卧浮生 浏览 2056 07-24

高圆圆、朱珠美上热搜的蓝色穿搭,太适合夏天了!

LinkFashion 浏览 7347 07-30

印尼国家队经理:克鲁伊维特教练团队必须重新接受评估

懂球帝 浏览 16 10-13

送"游戏本"还附带游戏说明 上科大本科录取通知书火了

封面新闻 浏览 8617 07-26

增程动力有智驾 别克5米长大轿车命名"至境L7"

网易汽车 浏览 7226 07-18

脱颖而出!每体:弗里克初步决定带17岁德罗、18岁托伦茨去日本

直播吧 浏览 589 07-21

塞尔:西足协裁判技术委员会AI主管曾声称自己是一位皇马球迷

懂球帝 浏览 3875 07-22

带队英超客胜曼城和利物浦,阿莫林是近五个赛季唯一一人

懂球帝 浏览 13 10-21

重量仅398g,vivo Vision探索版发布,12家授权店即将开启体验

网易科技报道 浏览 41 08-22

比亚迪方程豹豹 5 天神版、钛 3 全系车型 OTA 推送

IT之家 浏览 7709 08-05

热搜第一!黑神话新作"钟馗"来了,"悟空"还得再等等

国际金融报 浏览 4379 08-21

专家:多名前"正国级"被处分 越南新一届领导人敲山震虎

上观新闻 浏览 3608 07-21

使用性别争议选手,越南U21女排世锦赛成绩作废!越南排协:上诉

全景体育V 浏览 5116 08-14

克宫回应特朗普“最后通牒”:俄方需要时间分析

环球网资讯 浏览 2078 07-16

巴萨旧将:沙特俱乐部愿意3000万签费兰,并给球员3000万工资

懂球帝 浏览 4271 07-31

《中国互联网发展报告(2025)》正式发布

澎湃新闻 浏览 8085 07-26

环球圆桌对话:G7打造“稀土联盟”更像是政治表演

环球网资讯 浏览 8 10-24

潘长江靠短剧实现逆袭,截下特朗普的流量?

最爱酷影视 浏览 4063 08-04

向太曝张艺谋巩俐分手内幕,女方逼婚不成移情,老谋子彻夜痛哭

不八卦会死星人 浏览 18 10-14

TA:姆巴佩已被任命为皇马新赛季直接任意球和点球主罚手

懂球帝 浏览 46 08-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3