关闭广告

GPT-5不够惊喜

北京商报2025-08-11 00:00:026929人阅读

千呼万唤,GPT-5面世了。一键生成网页、写作像诗人、更懂健康问题,OpenAI称它将彻底改变人们工作、学习及创新方式。但许多人表示,这次GPT-5并没有带来更多的惊喜,反倒是价格策略成了此次发布的最大亮点。GPT-5上线后,社交媒体出现不少关于GPT-5使用感不佳的吐槽,更有用户直呼"还我GPT-4o"。面对用户争议,OpenAI发文宣布,重新上线GPT-4o,供Plus和Team用户使用。


"博士级专家"

自2018年OpenAI发布首个大模型GPT-1以来,GPT系列已经走过了七年。2020年GPT-3的出现,让大模型参数规模从15亿直接拓展到了1750亿,也因此通过"上下文学习"能力,摆脱了对大量标注数据的依赖,使大模型能够开始作为效率工具使用。

两年后,基于GPT-3.5构建的对话式模型ChatGPT上线,进一步推动大模型走入C端日常,成为通用AI应用的重要落地转折点。随后GPT-4的全面升级,更是在实现万亿级模型参数的同时,让大模型在单纯文本输出的基础上,实现了图像的交互提升。

美东时间8月7日,OpenAI正式发布GPT-5。新模型发布后,OpenAI联合创始人、首席执行官萨姆·奥尔特曼在一场访谈中表示,相比于GPT-4,GPT-5不仅能解答各种难题,更能实现即时的、按需的软件开发,并将彻底改变人们工作、学习及创新方式。

奥尔特曼用三个身份,类比了公司三代旗舰模型的演进:GPT-3像是偶有灵光闪现但常伴挫败感的高中生;GPT-4则如同具备了真实智慧与实用价值的大学生;而最新的GPT-5,则被誉为可以按需召唤的"博士级专家",能够随时助力用户达成各种复杂目标。

OpenAI声称,GPT-5在超高难度的科学问题上刷新了世界纪录,并在与人类专家的对比测试中,有近70%的场景表现更优。此外,GPT-5还与现有的o系列模型进行了无缝整合,能够根据任务的复杂性,自动选择最佳的推理路径。官方数据显示,GPT-5在代码生成和写作领域的准确率均高于GPT-4系列,部分内部测试中的错误率甚至下降了约80%。

值得一提的是,在访谈中,奥尔特曼表示,GPT-5在健康建议方面的能力显著提升,它的答案更准确、幻觉更少,更有可能告知真正的病因和应对措施。奥尔特曼还表示,在2035年,人们将能借助这些工具治愈或至少有效治疗许多目前仍在困扰人类的疾病。

在奥尔特曼看来,在GPT-8时代,人们可以利用这一AI工具治疗某种癌症。比如,GPT-8会先遍历所有现存的研究与数据,并提出治疗思路。随后告知用户:"我需要你找一个实验室完成这9个实验,并反馈结果。"

边际收益递减

近两年,随着AI工具开始席卷各行各业,人们渴望AI能够取代重复繁琐的工作,也在担忧自己是否会被AI所取代,这也是GPT-5发布前备受关注的原因之一。

但相比此前GPT-3到GPT-4所带来的全方位升级,许多人表示,这次GPT-5并没有带来更多的惊喜,从发布会规模、产品亮点到性能升级,都显得较为平庸,相较当前主流SOTA模型,提升幅度并不显著。

从第三方的基准测试数据来看,GPT-5相较于竞争对手的旗舰模型,其领先优势也微乎其微。根据Artificial Analysis的综合排名,GPT-5目前虽然位列第一,但其综合得分仅比自家的老模型o3高出两分,比Grok 4仅高出一分。而在被誉为AGI终极测试的Arc Prize竞赛中,GPT-5更是被Grok 4大幅超越。

OpenAI在发布会上还特别强调了GPT-5在代码生成和写作方面的能力。然而,用户的实际使用体验,似乎并未完全印证官方的说法。Meta公司的一位工程师体验GPT-5后在社交媒体上感叹道:"GPT-5仅用一次调用就重构了我的整个代码库:25个工具调用,3000多行新代码,12个全新的文件。"但他随即话锋一转:"然而,这些代码都无效(无法正常工作),虽然确实写得很漂亮。"

"GPT-5不太可能‘超越一切预期’,因为大模型的边际收益正在迅速递减。"AI营销与销售专家、太和智库研究员唐兴通分析指出,"我们今天所看到的所谓‘进步’,更多是来自于工程层面的调优和多模态能力的融合,而非纯粹的智能层面上的突破。"

他认为,AI的发展正面临两大物理限制:"我们必须清醒地认识到,‘数据墙’是客观存在的,高质量的公共训练数据正在被快速耗尽。同时,算力成本的指数级增长,也让过去那种‘大力出奇迹’的暴力美学难以为继。"

不过,不少人表示价格很"香"。GPT-5的API调用价格仅为前几日发布的Claude Opus 4.1的1/15,显著低于Gemini 2.5 Pro,在当前大模型市场上展现出极强的性价比。

缺少温度

最新数据显示,今年8月ChatGPT周活跃用户已达7亿,同比增长4倍。其付费用户数从2024年的300万增至500万,Pro会员和企业版用户贡献了超60%的收入。

庞大的用户规模,帮助ChatGPT的商业收入再创新高。曾有媒体报道,截至今年7月末,OpenAI预计将实现120亿美元的年度经常性收入,成为全球最大的AI创业公司。它的最大竞争对手Anthropic同期收入预计仅为50亿美元。

不过,OpenAI的挑战也显而易见。尤其是在企业级市场,OpenAI的市场份额正在迅速被竞争对手蚕食。近期,海外投资机构Menlo Ventures发布的一份报告显示,Anthropic在企业大语言模型市场占有率已达32%。相比之下,OpenAI的市场份额仅为25%。

ChatGPT-5上线后,不少用户发现OpenAI停用了GPT-4o版本。社交媒体出现不少关于GPT-5使用感不佳的吐槽,更有用户直呼"还我GPT-4o"。用户对GPT-5的"吐槽",主要集中在新模型虽提升了回答的专业度,但却缺少了情感交互的温度、个性及想象力。

面对用户争议,OpenAI发文宣布,重新上线GPT-4o,供Plus和Team用户使用,若需多平台使用,用户可在ChatGPT网页版设置中启用"显示旧版模型"访问GPT-4o。与此同时,下周还将推出迷你版GPT-5和GPT-5 thinking。

针对用户对GPT-5的负面反馈,奥尔特曼解释称,这是由于自动切换器损坏,致使GPT-5表现异常。他表示,未来将专注于完成GPT-5的部署与改进,并确保其稳定性。奥尔特曼同时透露,GPT-5上线后,ChatGPT API流量在24小时内翻倍增长,OpenAI正在全力优化系统并寻找更多的容量。但他坦言,预计下周仍将面临严峻的容量挑战。

奥尔特曼坦言,低估了用户对GPT-4o的喜爱程度,并表示这强化了公司为不同用户提供定制化服务的理念,未来将推出比当前更多的定制化内容。同时,其宣布将允许Plus用户继续使用GPT-4o,并将密切关注用户使用情况,考虑旧版本模型的保留期限。

北京商报记者 赵天舒

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

佩杜拉:那不勒斯确实对米雷蒂感兴趣,但交易或涉及韦尔加拉

懂球帝 浏览 4957 07-25

牛弹琴:特朗普实在看不下去了 强硬表态要"夺回首都"

映象网 浏览 4283 08-11

京东外卖新模式:上岸第一剑,先斩餐饮商家

躺平指数 浏览 7859 07-25

汪小菲终于拎清了

小娱乐悠悠 浏览 12 08-29

多个未成年人遭围殴 霸凌者叫嚣:我没16岁欢迎报警

极目新闻 浏览 2674 07-27

宗庆后弟弟吐槽宗馥莉:要那么多钱干嘛 天堂又不能用

金融界 浏览 2878 07-18

深夜,特斯拉暴跌!特朗普将视察美联储,近20年来首次

证券时报 浏览 3656 07-25

菲总统疯狂玩火 媒体:菲与中国台湾最短距离仅200公里

扬子晚报 浏览 6512 08-10

9月1日起,个人养老金提取条件放宽,哪些人可领取、如何领取?

第一财经资讯 浏览 5633 08-20

乌克兰基辅遭空袭 乌官员称已致3人死亡

新京报 浏览 5995 05-25

西贝老板喊话:“请外卖平台把定价权还给商家”

每日经济新闻 浏览 4054 07-20

E句话 | 泳衣不能下水游泳,啊?

仙女事件簿 浏览 7252 07-14

俄乌冲突再创“无人机空战”新模式

环球网资讯 浏览 5579 07-31

记者:未来两年内 福克斯&卡斯尔&哈珀至少一人会离开马刺

直播吧 浏览 8682 08-05

外媒:以军证实空袭也门萨那国际机场

环球网资讯 浏览 1035 05-07

身材比例五五分的森林北,让汪峰“颜面尽失”

章媸解说体育 浏览 1408 07-22

普京10年来首次赴美 也系首位前往阿拉斯加州的俄元首

环球网资讯 浏览 9327 08-09

俄外长拉夫罗夫身着苏联字样运动衫现身阿拉斯加

澎湃新闻 浏览 8185 08-16

特朗普深夜高调喊话中国 突然低声下气地"求人帮助"

博览历史 浏览 8036 08-13

菲总统叫嚣:若台海发生冲突 或将与中国"全面战争"

扬子晚报 浏览 1238 08-09

媒体:俄罗斯很可能会成"五常"中唯一没有航母的国家

枢密院十号 浏览 4207 07-15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3