关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:011318人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (Minh Nhat Nguyen)评价道:“Claude Code在几乎没有市场推广的情况下,5个月内就做到4亿美元营收,简直不可思议。”

然而,在开发者社区,一些人对此次发布的时机提出了质疑。业内普遍预计OpenAI即将推出的GPT-5将直接挑战Claude在编程领域的优势地位,因此有观点认为Anthropic此次发布略显仓促。AI开发者社区KOL亚历克·维利卡诺夫 (Alec Velikanov)在将该模型与竞争对手进行用户界面任务对比后评论称:“Opus 4.1感觉像是为了抢在GPT-5前发布而赶工的产品。”

格局推演:客户集中的风险与巨头环伺的挑战

伴随此次技术发布的是公司收入的爆炸式增长。据行业数据显示,Anthropic的年度经常性收入在短短七个月内增长了五倍。其API业务的年度经常性收入已达到31亿美元,但其中近一半(14亿美元)仅来自两个大客户:编程助手Cursor和旗下的GitHub 。

这种高度集中的客户结构引发了业界的担忧。罗技 (Logitech)高级产品经理纪尧姆·勒韦迪耶 (Guillaume Leverdier)在社交媒体上评论道:“这其实很危险。一份合同的变更,就可能让企业陷入困境。”

对主要客户GitHub Copilot的依赖,更使Anthropic与微软的关系变得尤为复杂。微软不仅是OpenAI的重要股东,其本身也拥有强大的AI能力,这让其子公司GitHub Copilot严重依赖Anthropic模型的情况充满了潜在的利益冲突。Perplexity商业研究员西亚·马里(Siya Mali)看来,这种与竞争对手的“间接绑定”,无疑是Anthropic的一大潜在软肋。

目前,AI编程市场已成为一个价值数十亿美元的高风险战场。行业分析师彼得·戈斯捷夫 (Peter Gostev)指出:“几乎所有的编程助手现在都默认使用Claude 4 Sonnet。”他认为,Anthropic的增长极度依赖其在编程领域的领先地位,一旦GPT-5挑战成功,导致Cursor和GitHub Copilot等大客户转向OpenAI,市场格局可能会发生逆转。

展望未来,行业分析师文卡特·拉曼 (Venkat Raman)预测,随着硬件成本下降和推理优化技术的进步,AI能力可能会逐渐商品化。Anthropic目前正通过扩展Claude Code订阅服务来降低对少数API客户的依赖。公司能否在下一轮竞争中保持其技术优势,将是其能否维持高速增长的关键。(易句)

(本文由AI翻译,网易编辑负责校对)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

皮雷:阿森纳要是今年拿不了联赛冠军,阿尔特塔就得下课

懂球帝 浏览 21 10-02

翟潇闻粉丝掀桌三搭,无牌硬耍还是破圈无门?

八卦三缺一 浏览 1965 07-22

S妈又深夜哭诉想念女儿大S!评论区各种挖苦嘲讽

小徐讲八卦 浏览 8939 07-16

不足10人的团队,如何撬开华为生态?

虎嗅APP 浏览 401 07-27

韩媒:中国男足有意任命克林斯曼为主帅,他在6年前就表达过意愿

直播吧 浏览 8957 08-06

60岁大爷成大一新生否认"高考钉子户":参加高考2次

大风新闻 浏览 46 09-21

许绍雄最新状况!戴氧气罩不能说话,大半港圈明星探视人缘极好

萌神木木 浏览 5 10-28

英剧巡礼:一份关于英伦取景地的旅行清单

时尚COSMO 浏览 62 08-23

TA:巴萨还看中了拉什福德的国际影响力,进一步拉动球衣销量

懂球帝 浏览 1153 07-20

支持双5C超充,阿维塔06 Ultra增程版上市

观察者网 浏览 47 09-01

官宣!莫兰德重返辽篮:曾助队3连冠建立王朝 结束广东短暂生涯

醉卧浮生 浏览 5447 07-29

中国互联网大会聚焦AI赋能新型工业化发展,专家热议具身智能

澎湃新闻 浏览 9822 07-26

新能源车双税新政发布,郑州消费者该“下手”还是“等等”?

大象新闻 浏览 16 10-13

俄红粉军团遭团灭!卡林斯卡娅成速败名花,安德列娃被批哭错时辰

网球之家 浏览 198 08-03

78岁父亲花光钱给中风儿子治病 儿媳拒照顾:他曾出轨

福建第一帮帮团 浏览 3382 07-24

老公狂亏150亿后,她出来挣钱还债了?

Yuki女人故事 浏览 1654 07-09

友谊赛直播流崩溃后纽卡官方道歉,球迷:真是什么事都干不成

懂球帝 浏览 3208 08-10

全链条协同下,科技成果如何走出实验室?钟南山院士:双转化、双推广至关重要

时代财经 浏览 53 08-25

特朗普威胁:核谈判不成 美或"带头"攻击伊朗

参考消息 浏览 6526 04-27

618链接合集 ‖ 进来一键查漏补缺!

黎贝卡的异想世界 浏览 9042 06-17

鹰击19首披露 中国高超音速导弹彻底甩开美俄雄踞第一

文雅笔墨 浏览 67 08-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3