关闭广告

抢在GPT-5前升级模型,Anthropic发布Opus 4.1,编程、研究、数据分析更强大

华尔街见闻官方2025-08-06 12:00:022750人阅读

人工智能(AI)模型的竞赛再度升温。在OpenAI即将发布备受期待的GPT-5之际,Anthropic率先升级自家模型,推出Claude Opus 4.1,声称在编程、研究和数据分析能力方面实现显著提升。

美东时间8月5日周二,由前OpenAI员工创立的OpenAI劲敌Anthropic宣布,新模型Opus 4.1在编程评估基准SWE-Bench Verified上的得分达到74.5%,较前代Opus 4的72.5%提升两个百分点。

新模型在处理大型代码库导航和多文件代码重构方面表现尤为突出。GitHub、Rakuten Group等客户反馈显示,Opus 4.1在代码修改精准度和调试效率方面均有显著改善,能够在不引入漏洞的情况下精确定位需要修正的代码位置。

面对OpenAI本月可能发布GPT-5的竞争压力,Anthropic选择聚焦现有产品优化。

Anthropic的首席产品官Mike Krieger表示,此次Opus模型升级标志着公司战略转向更频繁的渐进式改进,而非仅专注重大版本更新。他说:

“过去,我们过于专注于只提供重要的升级。(模型)它现在在编码、推理和代理任务方面都更胜一筹。我们只是想让它更好地服务于人类。”

性能提升聚焦编程领域

Anthropic公布的数据显示,Opus 4.1在编程能力方面实现了实质性突破。

Anthropic公布,在评估大语言模型(LLM)完成现实世界软件工程能力的SWE-Bench Verified基准测试中,Opus 4.1取得74.5%的准确率。这一成绩相比Claude Sonnet 3.7的62.3%和Opus 4的72.5%有明显进步。


Anthropic强调,升级后的Opus模型在处理复杂多步骤问题时更加高效,定位为更有效的AI代理。新模型能够更好地导航大型代码库,在代码修改时更加精确。

Opus 4.1还“提升了Claude 的深入研究和数据分析能力,尤其是在细节追踪和代理搜索方面。”

Anthropic本周二表示,被Cognition收购的AI编程助手Windsurf反馈称,Opus 4.1在其初级开发人员基准测试中较Opus 4有一个标准差的改进,性能提升幅度相当于从Sonnet 3.7跃升至Sonnet 4的水平。

客户反馈验证实用价值

Anthropic本周二提到一些企业客户的使用反馈,它们证实了新模型的实际改进效果。

比如日本电商巨头乐天集团(Rakuten Group)发现,Opus 4.1擅长在大型代码库中精确定位需要修正的位置,无需进行不必要的调整或引入漏洞,乐天的团队倾向于利用该模型的这种精确性处理日常调试任务。

Windsurf表示,使用Opus 4.1后编程任务完成速度更快,质量也有所提高。GitHub则指出,Opus 4.1相对于Opus 4在大多数功能上都有改进,在多文件代码重构方面的性能提升尤为显著。

市场竞争加剧背景下的战略调整

Anthropic此次发布正值AI行业竞争白热化之际。谷歌和OpenAI都推出了帮助程序员简化代码编写和调试流程的功能,而OpenAI高管也在公开场合为即将发布的GPT-5造势,有报道称该产品可能在本月推出。

被问及OpenAI即将发布的产品时,Mike Krieger表示:"我学到的一点是,我们要专注于自己拥有的东西,尤其是在快速发展的AI领域,其他人要做什么最终取决于他们自己。"

Anthropic本周二表示,Opus 4.1现已向付费Claude用户开放,并可通过Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI获得,定价与Opus 4保持一致。Anthropic还计划,未来几周内发布更重大的模型更新。

Anthropic被传新融资或推升估值至1700亿美元

将近两周前,7月中旬媒体称,Anthropic称其年化收入今年上半年增长四倍,已超过40亿美元,其爆炸式的收入增长引起部分投资者浓厚兴趣,考虑以超过1000亿美元的估值进行新一轮投资,较四个月前该司宣布融资时的580亿美元估值几乎翻了一番。

此后,有媒体在与多位中东投资者交流后表示,Anthropic即将到来的估值更接近1500亿美元。

上周又有媒体称,Anthropic正进行Iconiq Capital主导的新一轮融资相关磋商,拟融资30亿至50亿美元,使公司估值达到1700亿美元。另有媒体称,到7月末,Anthropic的年化收入已增至约50亿美元。该司预计,到今年年底,其经常性收入可能达到90亿美元。

Anthropic的新融资消息凸显了市场对头部AI公司未来增长的极高预期,尤其是对Anthropic在AI编码这一应用领域的强大变现能力方面。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今日热点:张震岳老婆怀二胎;《藏海传》连续5天灯塔电视剧播放量冠军……

伊周潮流 浏览 4696 05-24

职工去上班被洪水冲走未被认定工伤 家属起诉法院判了

大象新闻 浏览 5447 08-05

向上社交为何会失败?

虎嗅APP 浏览 2461 07-24

“金融科技第一股”退市加速 将与平安⽣态系统整合

21金融圈 浏览 1390 07-22

李连杰讲述病情:62岁生日时发现颈部肿块 确定是良性

鲁中晨报 浏览 15 08-29

原配自杀、儿子残疾,再娶小12岁娇妻,难怪唐国强73岁还这么拼

不八卦会死星人 浏览 4717 08-12

伊朗外长:感谢中方

环球时报 浏览 4893 07-18

孙颖莎谈晋级决赛:整体感觉比较正常,石洵瑶的相持能力很强

直播吧 浏览 610 08-11

李强主持召开国务院常务会议 审议通过《“三北”工程总体规划》

新华社 浏览 22 08-23

《生万物》撕开残酷人生:你吃的饮食,暴露了你的阶层

娱乐圈笔娱君 浏览 1008 08-16

葛斯齐曝《爸爸去哪儿》嘉宾和粉丝出轨偷情,多个细节指向夏克立

萌神木木 浏览 6341 08-08

大疆全新运动相机 Osmo Nano 曝光:强调尺寸取消前置副屏

IT之家 浏览 5108 08-09

紫牛热点|网友发帖称小米智能门锁夜晚被外卖员用人脸识别打开,客服回应

扬子晚报 浏览 1586 08-12

伊姐周日热推:电视剧《献鱼》;电视剧《子夜归》......

伊周潮流 浏览 7655 08-18

ESPN:堪萨斯城曾接近签下C罗,但球员最终选择了利雅得胜利

直播吧 浏览 2099 08-13

谷歌 Pixel 10 Pro Fold 折叠屏手机官方渲染图公布:告别黑白

IT之家 浏览 5630 07-24

游客发现中午店铺都歇业,山西为何成了午睡大省?

BT财经 浏览 5905 07-28

偶遇洪欣母女出行,11岁张晞彤身高优越

联友说娱 浏览 6740 07-21

李想老友创业7年,拒绝孙正义控股,要做商用车里的特斯拉

中国企业家杂志 浏览 7766 08-19

亏懵了!明星基金经理新基金成立仅两月亏去8%,和大盘反着走,基民:让人失望

红星资本局 浏览 5875 08-12

AI如何赋能生命科学:用“万能函数”表征生命

澎湃新闻 浏览 2687 07-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3