关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:011424人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (Minh Nhat Nguyen)评价道:“Claude Code在几乎没有市场推广的情况下,5个月内就做到4亿美元营收,简直不可思议。”

然而,在开发者社区,一些人对此次发布的时机提出了质疑。业内普遍预计OpenAI即将推出的GPT-5将直接挑战Claude在编程领域的优势地位,因此有观点认为Anthropic此次发布略显仓促。AI开发者社区KOL亚历克·维利卡诺夫 (Alec Velikanov)在将该模型与竞争对手进行用户界面任务对比后评论称:“Opus 4.1感觉像是为了抢在GPT-5前发布而赶工的产品。”

格局推演:客户集中的风险与巨头环伺的挑战

伴随此次技术发布的是公司收入的爆炸式增长。据行业数据显示,Anthropic的年度经常性收入在短短七个月内增长了五倍。其API业务的年度经常性收入已达到31亿美元,但其中近一半(14亿美元)仅来自两个大客户:编程助手Cursor和旗下的GitHub 。

这种高度集中的客户结构引发了业界的担忧。罗技 (Logitech)高级产品经理纪尧姆·勒韦迪耶 (Guillaume Leverdier)在社交媒体上评论道:“这其实很危险。一份合同的变更,就可能让企业陷入困境。”

对主要客户GitHub Copilot的依赖,更使Anthropic与微软的关系变得尤为复杂。微软不仅是OpenAI的重要股东,其本身也拥有强大的AI能力,这让其子公司GitHub Copilot严重依赖Anthropic模型的情况充满了潜在的利益冲突。Perplexity商业研究员西亚·马里(Siya Mali)看来,这种与竞争对手的“间接绑定”,无疑是Anthropic的一大潜在软肋。

目前,AI编程市场已成为一个价值数十亿美元的高风险战场。行业分析师彼得·戈斯捷夫 (Peter Gostev)指出:“几乎所有的编程助手现在都默认使用Claude 4 Sonnet。”他认为,Anthropic的增长极度依赖其在编程领域的领先地位,一旦GPT-5挑战成功,导致Cursor和GitHub Copilot等大客户转向OpenAI,市场格局可能会发生逆转。

展望未来,行业分析师文卡特·拉曼 (Venkat Raman)预测,随着硬件成本下降和推理优化技术的进步,AI能力可能会逐渐商品化。Anthropic目前正通过扩展Claude Code订阅服务来降低对少数API客户的依赖。公司能否在下一轮竞争中保持其技术优势,将是其能否维持高速增长的关键。(易句)

(本文由AI翻译,网易编辑负责校对)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

瓜帅:福登在前锋身后真的很有威胁,他在禁区附近表现非常完美

直播吧 浏览 97 09-25

媒体:关于台湾问题 2028年有3个关键时间节点

经济观察报 浏览 77 01-08

ESG领跑者|对话英飞凌高级副总裁于代辉:如何以半导体技术撬动全球减碳未来?

澎湃新闻 浏览 140 08-25

夸梅:麦迪说得好像自己离冠军一步之遥 闹半天连首轮都没突破

直播吧 浏览 78 09-25

长安汽车归属仍是谜,控股股东更名有何深意

帮宁工作室 浏览 7926 06-26

天空记者:阿森纳的冬窗会相对平静,他们想在夏季完成交易

懂球帝 浏览 85 12-23

马德里竞技,贝蒂斯国王杯四分之一决赛对手

绿茵情报局 浏览 78 01-23

Cariad不再是“灵魂”担当,大众请外援能否赌赢未来?

禾颜阅车 浏览 111 10-20

小高领,现在穿刚刚好

Yuki女人故事 浏览 77 01-27

黄宗泽称:不结婚是报复母亲 母亲总强烈反对女友

动物奇奇怪怪 浏览 763 07-08

万斯称美国正考虑向乌克兰提供“战斧”导弹

央视新闻客户端 浏览 105 09-29

15.69万起 郑州日产Z9 GE电混皮卡上市

网易汽车 浏览 6745 06-01

普京发出警告:北约欺人太甚 再不收手迟早遭俄核打击

空天力量 浏览 519 07-24

邓承浩姜海荣组CP将为深蓝汽车带来哪些变化?

EV世纪 浏览 140 09-11

费迪南德:阿森纳不需要埃泽,当然他也可以提升板凳深度

懂球帝 浏览 728 08-05

离谱!荣梓杉李禹熹聊天记录曝光,女方求荣梓杉报销372元房费

扒虾侃娱 浏览 126 10-17

海纳:现在不会透露科曼的未来,未来三周会继续看看转会市场动向

直播吧 浏览 8330 08-11

美媒扒哈登末节细节:快船追到只差15分 登哥穿训练服两眼空洞

Emily说个球 浏览 112 12-02

演员姜超:出道31年不温不火,相亲20次才遇对人,如今他过得怎样

小杨侃事 浏览 2407 08-11

王兴兴:让机器人真正干活,这个“临界点”亟待突破

澎湃新闻 浏览 7536 08-03

上新|《新消费理论》:提高家庭收入是唯一出路

智本社 浏览 2396 08-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3