关闭广告

GPT-5第一波用户反馈:笨拙,还我4o

华尔街见闻官方2025-08-09 12:00:029544人阅读

OpenAI备受瞩目的新一代模型GPT-5在发布后遭遇了意想不到的初步反应,部分早期用户抱怨其表现“笨拙”,甚至不如前代产品。

许多用户表示,这款被誉为能将ChatGPT提升至“博士级专家”水平的新模型,在实际使用中却频频在简单的数学和拼写问题上出错,甚至会编造信息。有许多付费用户表达了失望情绪,甚至呼吁恢复使用其前代模型GPT-4o。

OpenAI首席执行官Sam Altman于周五迅速做出回应。他承认GPT-5的发布过程“坎坷”,并将用户体验不佳归咎于技术故障。Altman表示,一个负责根据用户提问自动选择不同复杂程度模型的“自动切换器”在发布当天大部分时间处于失灵状态,导致系统调用了较弱的模型,使得GPT-5看起来“笨拙得多”。

对OpenAI而言,此次发布的成败攸关重大。该公司不仅需要以此证明其在人工智能领域的持续领先地位,更需要说服企业和个人用户为其高级服务付费。这些收入对于抵消其在人才、芯片和数据中心等方面的巨额投入至关重要,而一个不稳定的开局无疑会为这一商业目标蒙上阴影。

“自动切换”机制引发困惑

此次用户负面反馈的根源,很大程度上指向了GPT-5底层一个全新的运行机制。与以往版本不同,GPT-5引入了一个“自动切换器”(autoswitcher),系统会根据用户查询的复杂程度,自动在不同等级的模型之间进行切换。OpenAI希望通过这种方式最大限度地优化其宝贵的计算资源。

然而,这种设计也意味着用户并非总能调用OpenAI最强大的技术。当该切换机制未能准确判断或出现故障时,用户的体验便会大幅下降。

一个测试案例生动地说明了这一点:当被问及单词“blueberry”中有几个字母“b”时,GPT-5最初给出了错误的答案“三个”。但在被提示“再想一想”之后,系统似乎调用了更高级的推理模型,最终给出了正确答案。这一机制的不透明性是用户感到困惑和不满的主要原因之一。

尽管负面反馈占据了社交媒体的头条,但GPT-5的早期评价呈现两极分化。部分专业人士在试用后给出了积极评价。开发者Simon Willison在一篇博客文章中称GPT-5是“我最喜欢的新模型”,认为它“能胜任工作”且“偶尔表现出色”,但也补充说,“它与我们之前拥有的模型没有本质上的区别”。

宾夕法尼亚大学沃顿商学院教授Ethan Mollick则对其研究、写作和简化编程的能力感到惊叹:

“GPT-5 只是自己做一些事情,通常是非凡的事情,有时是奇怪的事情,有时是非常人工智能的事情,这就是它如此有趣的原因。”
Altman承认首秀失误并承诺改进

面对汹涌的负面评价,OpenAI管理层试图平息用户的担忧。在周五于Reddit平台举行的“Ask Me Anything”(AMA)活动中,Altman坦承了发布初期的技术问题。他承诺,“从今天开始,GPT-5会显得更智能”。

他表示,OpenAI正在研究允许Plus付费用户继续使用GPT-4o的方案,并将为Plus用户提供双倍的使用速率限制,以鼓励他们更好地适应新模型。

“在我们完成推广后,我们将把 Plus 用户的速率限制提高一倍。”

此外,针对发布会上引发“图表犯罪”(chart crime)嘲讽的一张严重失准的图表,Altman在社交平台X上承认这是一个“巨大的图表失误”,进一步显示了此次发布的仓促与混乱。


根据用户排名的流行榜单LMArena,GPT-5在周五中午已升至多个类别的榜首。但另一个基准测试ARC-AGI-2则显示,GPT-5落后于xAI的最新版Grok模型。

GPT-5的此次发布正值人工智能领域竞争空前激烈的时刻,这使其表现出的任何不稳定性都备受关注。OpenAI正努力维持其近三年前由ChatGPT引爆的生成式AI热潮所带来的领先优势,而包括马斯克的xAI在内的竞争对手正穷追不舍。

对于每周拥有近7亿用户的ChatGPT而言,一个平稳、可靠的用户体验是维持其市场地位和证明其商业价值的关键。此次发布的波折,无疑对投资者和市场信心构成了一次考验。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一场82-43,让17万小国创历史!首次打亚洲杯便出线,中国队利好

侃球熊弟 浏览 3671 08-11

北溪爆炸案乌嫌犯被捕 俄媒:6人组如何避开北约侦测

澎湃新闻 浏览 15 08-26

贵州茅台半年报透视:勇于走出舒适区、等待下一跃升期

铑财 浏览 4096 08-19

博士论文致谢讲述下煤窑、专升本经历走红 当事人回应

极目新闻 浏览 2606 07-18

黄子韬陪徐艺洋试婚纱曝世纪婚礼!曾卖卫生巾20天赚5000万

娱乐白名单 浏览 2914 07-13

特朗普刚签中美"休战令" 大批对华强硬美官员萌生退意

博览历史 浏览 4987 08-13

iPhone 17系列价格曝光:只有标准版没涨价

快科技 浏览 5869 08-06

不伦风波后何猷君首现身!和妻子奚梦瑶同进同出

萌神木木 浏览 7397 08-12

"淘宝第一个程序员"离职:在阿里任职25年 成亿万富豪

红星新闻 浏览 1477 08-14

乐道L90大三排SUV 7月31日上市,预售价27.99万元起

IT之家 浏览 1144 07-22

​多款美元理财产品“提前止盈”,咋回事?

中国商报 浏览 7297 07-25

AI聊天机器人诱导线下约会,一位老人死在寻找爱情的路上

第一财经资讯 浏览 19 08-25

东体:海港通过体系改造,激发莱昂纳多寻找射门空间的特点

直播吧 浏览 7818 08-20

盒马最后一家会员店月底停业:店内大部分货架已清空

新京报 浏览 1134 08-06

利润大降89%,美团真正的考验还在后面

中国企业家杂志 浏览 10 08-30

51岁游客疑坐护栏后仰坠崖身亡 文旅部门回应护栏高度

大风新闻 浏览 736 08-06

重磅引援!官方:曼联签下22岁前锋塞斯科,转会费总价8500万欧

直播吧 浏览 5114 08-10

泽连斯基改组内阁欲"重振政府" 被指"重新洗牌"

环球时报国际 浏览 6930 07-20

56岁解晓东近照曝光,走路晃肩戴墨镜很酷

喵姐爱娱乐8 浏览 2757 08-20

罗马诺:费内巴切就埃德森提交了新报价,转会正在走向实质

懂球帝 浏览 14 09-01

妻子与男小三约开房在车内当丈夫的面就亲热 丈夫崩溃

汉史趣闻 浏览 8154 08-03
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3