关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:011423人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (Minh Nhat Nguyen)评价道:“Claude Code在几乎没有市场推广的情况下,5个月内就做到4亿美元营收,简直不可思议。”

然而,在开发者社区,一些人对此次发布的时机提出了质疑。业内普遍预计OpenAI即将推出的GPT-5将直接挑战Claude在编程领域的优势地位,因此有观点认为Anthropic此次发布略显仓促。AI开发者社区KOL亚历克·维利卡诺夫 (Alec Velikanov)在将该模型与竞争对手进行用户界面任务对比后评论称:“Opus 4.1感觉像是为了抢在GPT-5前发布而赶工的产品。”

格局推演:客户集中的风险与巨头环伺的挑战

伴随此次技术发布的是公司收入的爆炸式增长。据行业数据显示,Anthropic的年度经常性收入在短短七个月内增长了五倍。其API业务的年度经常性收入已达到31亿美元,但其中近一半(14亿美元)仅来自两个大客户:编程助手Cursor和旗下的GitHub 。

这种高度集中的客户结构引发了业界的担忧。罗技 (Logitech)高级产品经理纪尧姆·勒韦迪耶 (Guillaume Leverdier)在社交媒体上评论道:“这其实很危险。一份合同的变更,就可能让企业陷入困境。”

对主要客户GitHub Copilot的依赖,更使Anthropic与微软的关系变得尤为复杂。微软不仅是OpenAI的重要股东,其本身也拥有强大的AI能力,这让其子公司GitHub Copilot严重依赖Anthropic模型的情况充满了潜在的利益冲突。Perplexity商业研究员西亚·马里(Siya Mali)看来,这种与竞争对手的“间接绑定”,无疑是Anthropic的一大潜在软肋。

目前,AI编程市场已成为一个价值数十亿美元的高风险战场。行业分析师彼得·戈斯捷夫 (Peter Gostev)指出:“几乎所有的编程助手现在都默认使用Claude 4 Sonnet。”他认为,Anthropic的增长极度依赖其在编程领域的领先地位,一旦GPT-5挑战成功,导致Cursor和GitHub Copilot等大客户转向OpenAI,市场格局可能会发生逆转。

展望未来,行业分析师文卡特·拉曼 (Venkat Raman)预测,随着硬件成本下降和推理优化技术的进步,AI能力可能会逐渐商品化。Anthropic目前正通过扩展Claude Code订阅服务来降低对少数API客户的依赖。公司能否在下一轮竞争中保持其技术优势,将是其能否维持高速增长的关键。(易句)

(本文由AI翻译,网易编辑负责校对)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

足球报:圈内人士看来,这场3-0是蓉城迈向亚洲顶级俱乐部的起点

直播吧 浏览 10016 08-13

从实验室到生产线南阳理工学院15年磨一剑赋能汽车制造升级

大象新闻 浏览 40 04-10

汪小菲马筱梅带娃返台,夫妻俩相约外出用餐,享二人世界好浪漫

扒虾侃娱 浏览 133 08-22

美方被指仍在追截第三艘油轮 并拟增派力量强行登船

环球网 浏览 73 12-28

重构模式,AI时代主流媒体以“智”擦亮老招牌

上观新闻 浏览 8675 07-28

29.2万辆!难怪比亚迪9月跟“疯了”一样,原来是给这几天憋大招

小李车评李建红 浏览 127 10-09

德保罗将身披迈阿密7号战袍:我准备好了!VAMOS INTER

直播吧 浏览 3870 07-26

定位纯电小型SUV 现代IONIQ 3假想图曝光

车质网 浏览 112 10-09

从女团C位到无戏可拍,当红小花陷换角风波,内娱寒冬有多残酷?

Yuki女人故事 浏览 7440 05-28

歌王名单泄露、耳返故障,网友质疑有黑幕

萌神木木 浏览 7895 08-10

纯电续航给到200km 2026款猛龙限时售15.38万起

网易汽车 浏览 1269 08-20

江铃旗下羿驰 05S 纯电紧凑型 SUV 将于10月16日上市

IT之家 浏览 127 10-13

理想大涨超6%,i8售价32万起,李想:曾遭遇汽车史上最大抹黑

21世纪经济报道 浏览 8858 07-30

外交部回应中方是否会和印巴双方接触来缓和局势

环球网资讯 浏览 4341 05-08

翟欣欣被判12年!欺负老实人终将付出代价

梦史 浏览 116 09-20

宋丹丹“没白活”家庭地位尽显 儿媳也百般讨好

章眽八卦 浏览 97 08-23

伊姐周日热推:电视剧《吴邪私家笔记》;电视剧《灼灼韶华》......

伊周潮流 浏览 241 09-22

李连杰大女儿结婚:礼物寒酸 20亿身价

来条娱吃 浏览 4599 08-11

多名儿童在博物馆翻越围栏 有家长让孩子把标本抱手上

看看新闻Knews 浏览 9757 08-11

广汽丰田全新威兰达申报

大象新闻 浏览 6252 08-11

女人过了50岁,穿衣掌握好了这4个简单套路,轻松穿出高级感

静儿时尚达人 浏览 2710 08-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3