关闭广告

ChatGPT-5“不够惊艳”?最新实测来了

财联社2025-08-09 12:00:026923人阅读

《科创板日报》8月8日讯(记者 李佳怡)ChatGPT-5,技术封顶了?

北京时间8月8日凌晨1点,人工智能巨头OpenAI正式推出GPT-5。发布会上,山姆·奥特曼比喻到:“GPT-3如对话高中生,偶有灵光但稳定性不足;GPT-4如与大学生对话,兼具智能性与实用性;而GPT-5则像是与专家交谈,一名各个领域堪称博士级的专家。”

发布会现场,OpenAI团队展示出GPT-5在编程、数理逻辑、文本创作、健康咨询、视觉感知等多维度,整体智能水平较前代产品均有较大更新与提升。

GPT-5在编程方面提升最大,尤其在复杂前端架构生成与大型代码库调试环节表现突出,用户只需提出相应需求,GPT-5就能生成网站、游戏等;文本创作模块同步升级,可将抽象概念转化为兼具文学性、情感共鸣与专业韵律的内容;此外在健康医疗领域,GPT-5能够基于用户背景、知识储备及地域特征动态生成个性化建议。

此外,GPT-5在事实性准确性方面也有较大进步。据OpenAI数据显示,相较于GPT-4o,GPT-5在通用任务中的事实错误率降低约45%;启用深度思考模式后,其错误率较o3模型下降约80%。

据OpenAI透露,目前GPT-5已向免费版、Plus版、Pro版以及Team版用户开放,企业版和教育行业的用户则需再等待一周方可使用新模型。其中,免费版用户虽可直接使用GPT-5,但仍有一定的限额,超额后将自动切换至GPT-5 Mini模型。

《科创板日报》记者随即更新ChatGPT,并对其进行实测发现,免费版用户现已可访问GPT-5基础功能。在中文版“自定义ChatGPT”界面中,能够看到最新上线的“人格”模式,包括挑剔者(犀利毒舌型)、机械(高效直言型)、倾听者(善解人意型)、技术宅(热情探究型)四类预设交互风格,用户可依据需求自主切换输出风格。


据OpenAI介绍,在GPT-5中部署了新型安全训练框架——安全补全(safe completions),即让模型在预设安全框架内生成最大化实用性的回答,而涉及潜在风险的请求,GPT-5则会明确标注拒绝原因并提供合规替代路径。

因此,当记者提出“怎么制作炸药”的问题时,GPT-5未简单拒绝回答,而是明确声明该问题涉及高危、违法信息,因此无法提供配方、比例及操作步骤等关键内容。同时主动转向建设性引导,询问用户是否需要整理炸药的化学原理与历史演变等合规替代材料。


需要注意的是,ChatGPT-5信息处理的稳定性还有待观望。记者先后向GPT-5发送硕士毕业论文与期刊论文,要求其归纳总结论文主题、框架、研究思路以及研究结论等信息,并生成相应的研究框架。

在针对学术文本处理能力的实测中可以看到,GPT-5对万字左右的期刊文献展现出高效稳定的解析能力,可快速提炼研究主题、逻辑框架与核心结论,并自主调用Python代码生成可视化研究导图。然而当处理超过4万字的硕士论文时,模型出现明显的逻辑断层与编码异常,未能完整构建研究框架。


形成完整思维导图的期刊文献与编码异常的硕士论文

记者也留意到,GPT-5全球上线短短一天内,小红书、X等海内外主流平台涌现密集用户反馈,质疑其实际体验与宣传存在落差,如人格模式机械感过强、长上下文理解稳定性不足、额度太少、功能升级幅度未达预期等问题。

“此次更新没有颠覆性惊艳的地方,给人一种OpenAI能力封顶的感觉。”有用户向记者坦言,“不如GPT-4好用。”

上海交通大学副教授、上海人工智能实验室青年科学家谢伟迪也向记者表示,感觉上OpenAI "还是太注重语言模型了,没有特别的注重多模态模型,没有当时GPT4或者GPT 4V的出来的时候惊艳了。”

针对用户对GPT-5缺乏创新性的质疑,西南证券研究院计算机首席分析师王湘杰则向记者指出,此次更新或为OpenAI战略重心转向"All in One"生态整合的标志。据其观察,以OpenAI为首的海外大模型厂商已从追求单点技术爆破,转为聚焦高可靠性架构优化与场景易用性升级,这也是产业进入下半场竞争的必然选择。

王湘杰表示,OpenAI内部希望未来ChatGPT能够成为用户日常刚性需求的首选入口,“就像现在大家每天都打开微信,对于OpenAI来说,他们希望将ChatGPT从工具进化为‘All in one’的AI Agent,最终在青年群体数字生活中占据绝对地位。”

此外,面对GPT-5在编程、医疗等领域逼近人类水平引发的职业替代忧虑,王湘杰向记者明确表示:“当前AI仍不具备取代人类职业的基础条件。”

“离AI取代人类的职业还有很长的路要走,包括AI的可靠性、适配性、能耗等方面,目前来看还是远远不够的。”王湘杰强调,AI向AGI演进仍需突破多重技术屏障,中长期定位仍是“效率增强工具”,核心价值在于重构人机协作范式、提高用户效率,而非替代人类角色。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

千亿洋河换帅,能否解决“掉队”困境?

侃见财经 浏览 1544 07-25

韩红发文暴露孙燕姿真实人品,整个娱乐圈沉默了

素衣读史 浏览 5191 07-18

命运多舛!九座大满贯得主、51岁的网坛传奇塞莱斯身患重症肌无力

直播吧 浏览 2502 08-13

每天干十几个小时,月赚五六千元,有人6万元盘下,几个月后2万多才脱手!曾经爆火的创业项目遭嫌弃

都市快报橙柿互动 浏览 82 01-15

重磅 | 2025中国消费年度智能创新名录揭晓:揭开消费增长的“虚与实”

第一财经商业数据中心 浏览 85 01-27

身价4500万欧!英媒:热刺将报价加纳乔,并将他视为孙兴慜替代者

直播吧 浏览 6383 07-30

2026 春节档终极 PK!沈腾周星驰二次交手

第一娱记 浏览 104 01-06

价值研究所|特斯拉、华为、小米入局,家用充电桩龙头迎来“突围”之战

中国基金报 浏览 150 09-26

体育生表演"男美人鱼"走红:行业男性较少 月薪近万元

深圳新闻网 浏览 2260 08-10

她曾是国民媳妇,为何会自毁前程?

品茗谈史论世事 浏览 198 09-25

美政府"停摆"破纪录 英伟达市值一夜蒸发1.4万亿元

每日经济新闻 浏览 96 11-05

全面大撤离!李嘉诚英国“套现”2000亿

创业家 浏览 3 05-09

售35.98万元起 第二代腾势D9正式上市

网易汽车 浏览 9 04-29

夏天真该试试这些穿搭,上紧下宽、腰部收紧,显瘦又修饰比例

静儿时尚达人 浏览 7312 06-22

“这个风格”今年冬天又火了!谁穿谁高级

LinkFashion 浏览 75 01-17

劝上年纪的女人,穿裙不选紧,穿裤不选短,更优雅大方

静儿时尚达人 浏览 5445 08-17

科技巨头AI竞赛转向表外融资,万亿债务定时炸弹成危机前兆?

华尔街见闻官方 浏览 102 11-01

动车疑因车头故障停留荒野4小时 12306回应

潇湘晨报 浏览 1968 07-27

中国商人在菲律宾被绑架:12名嫌犯落网 其中6名中国人

大风新闻 浏览 1350 07-16

全球最大容器镜像库Docker Hub安全调查:10000+镜像泄露敏感密钥

IT之家 浏览 86 12-11

从安欣到程兵,张译为何告别演艺圈?拒绝同质化表演的觉醒之路

Yuki女人故事 浏览 4640 05-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3