快斗优选

鱼羊鹭羽发自凹非寺
量子位 | 公众号 QbitAI

GPT-5，终于亮出真容！

最新实测，由奥特曼本人带来，迅速引发大量围观。

疯狂暗示了一周之后，虽说对话只是围绕电视剧推荐，但好歹是有官方实例了。

当然奥特曼其人，放料的同时还是少不了新的谜语┓( ´∀` )┏：

即将进入SaaS快时尚时代。

比起这种奥式基操，更令人兴奋的是，这次有眼疾手快的网友，截到了发布时间（秒删版）？？？

~~行吧，这一周的夜，熬起来吧伙计们。~~

使用超级对齐团队技术

八卦少叙，还是来看看“通用验证器”的具体作用。

消息称，OpenAI在开发GPT-5的过程中引入了通用验证器进行强化学习，能让模型在保持较高准确率的同时，输出更清晰的推理过程。

从超级对齐团队发表的论文来看，他们提出了一种“证明者-验证者游戏”的训练方法，简单来说就是先在模型内部划分证明者和验证者两种角色，再让彼此之间持续对抗：

“靠谱的证明者”负责给出正确的解题步骤，并让验证者认可。
“狡猾的证明者”故意给出错误步骤，并试图欺骗验证者。
小型“验证者”负责准确区分正确与错误方案。

证明者和验证者模型都来自GPT-4系列，且需保证验证者规模小于证明者，以确保小型验证者在一定程度上可以对齐人类验证结果。

为了量化不同角色的作用，分别设置证明者和验证者的效用函数。

证明者效用基于奖励函数，为“靠谱的证明者”施加与方案正确性和验证者打分正相关的奖励，而为“狡猾的证明者”提供与方案错误性和验证者打分正相关的奖励。

其中奖励函数需要满足两点要求，角色对齐的方案（如“靠谱的证明者”生成正确答案）获得的奖励将高于非对齐方案，且对齐方案中，验证者打分越高，奖励也随即增加。

验证者效用则采用交叉熵损失最小化判断误差。

然后进行多轮迭代训练，让证明者通过强化学习（PPO）优化，分别根据角色最大化奖励，验证者则学习如何更好地区分正确与错误解决方案。

实验结果证明，在每轮训练中，“靠谱”和“狡猾”证明者都能让验证者打分单调提升，而“靠谱的证明者”的准确性整体处于上升趋势，“狡猾的证明者”生成错误答案的比例呈现先下降后上升的表现，最终能生成与正确答案说服力相当的错误方案。

在多轮对抗训练后，“靠谱的证明者”的正确率和“验证者”的抗干扰能力都将不断提高，且让模型生成更准确且易读的输出，但与此同时，模型也能生成出更具欺骗性的错误答案。

基于该技术，GPT-5可以对每个答案进行评分，并只保留正确的答案循环训练，以推出可验证的易读性答案，后续即使人类无法完全理解模型的高级推理，也能通过可扩展的小型验证器构建起可检验性约束。

One More Thing

奥特曼疯狂抛媚眼，宣（chao）传（zuo）小连招一套接一套。

搞得网上也是真假料满天飞。

有抢跑实测视频的：

有“预测”基准的：

还有唱衰的。

The Information就爆料说，GPT-5研发遇到了比较大的困难，一方面，高质量训练数据供应不足；另一方面，大规模预训练收益下降，使得GPT-5的提升不会像GPT-3到GPT-4那样有明显的飞跃。

另外，还存在模型性能转化的落差问题。比如o3，在内部测试时表现出非常强大的性能，但在实际面向用户部署之后，性能却出现了大幅下降。

就如网友所质疑的：像此前的所有模型一样，GPT-5可能发布1周之后就会变笨。

不管怎么说，GPT-5箭在弦上，OpenAI应该不能不发……了吧？

参考链接：
[1]https://x.com/sama/status/1952071832972186018
[2]https://arxiv.org/abs/2407.13692

奥特曼首晒GPT-5实测！被曝使用老团队遗产

更多细节“泄露”ing

使用超级对齐团队技术

One More Thing

黄奕女儿，一...

亚马逊云科技...

今日热点：金...

美的致富路，...

奥迪官方提前...

记者：努涅斯...

vivo为何要做MR眼镜？胡柏山：MR眼镜可以做家用机器人的眼睛的大脑

当基金投资遇上社交媒体，是普惠金融还是“类传销”陷阱？

人到中年别乱穿！基础款+基础色，轻松穿出优雅得体的气质

加布里埃尔：约克雷斯很出色，至于我上赛季的庆祝？现在不能说

泽连斯基接受采访期间马林斯基宫两度停电俄官员回应

A股2025年分红额创历史新高分红次数居前上市公司名单一览

黄奕回应女儿被抵制：支持她勇敢面对

网友喊话李诞给柳岩道歉，李诞评论区被迫关闭！

开播第一天热度破8000！连刷3集！我想说: 这部刑侦剧要火向全国

我去！郑钧的女儿也太美了，1：1复刻郑钧美貌，难怪郑钧更宠女儿

联想一体机漏洞被紧急修复，可绕过安全启动植入恶意软件

电讯报：曼联总价8500万欧报价塞斯科曼联&纽卡都自认是球员首选

AI时代，寻找超级创业者！徐汇区发布政策扶持一个人赛过一群人的“大牛”

莱巴带伤轰16ACE击败张帅，新赛季目标再夺大满贯，小商取开门红

03年詹姆斯后弗拉格将成为首位新秀赛季即参加圣诞大战的状元秀

大洗牌开启？医药代表管理办法出台，客情回扣模式或将终结

显瘦的夏日通勤搭配，复古又时髦！

OpenAI向美国政府提供ChatGPT企业版：每个机构每年1美元

微胖女孩冬天怎么穿衣？看看这27套冬季穿搭LOOK，保暖又显瘦

车企自建高速超充站第一，理想汽车现金储备达 1107 亿元

苍山遇难8岁男童妈妈首发声：涉事机构说到现在不赚钱

每体：球打到巴萨球员手臂就会判点；轮到皇马就要“解读”

该！买！包！了！30款绝美初秋包包！拿去！

杰克逊霍尔开幕：鲍威尔讲话在即，地区联储主席忙打“预防针”？

奥特曼首晒GPT-5实测！被曝使用老团队遗产

更多细节“泄露”ing

使用超级对齐团队技术

One More Thing

黄奕女儿，一...

亚马逊云科技...

今日热点：金...

美的致富路，...

奥迪官方提前...

记者：努涅斯...

vivo为何要做MR眼镜？胡柏山：MR眼镜可以做家用机器人的眼睛的大脑

当基金投资遇上社交媒体，是普惠金融还是“类传销”陷阱？

人到中年别乱穿！基础款+基础色，轻松穿出优雅得体的气质

加布里埃尔：约克雷斯很出色，至于我上赛季的庆祝？现在不能说

泽连斯基接受采访期间马林斯基宫两度停电 俄官员回应

A股2025年分红额创历史新高 分红次数居前上市公司名单一览

黄奕回应女儿被抵制：支持她勇敢面对

网友喊话李诞给柳岩道歉，李诞评论区被迫关闭！

开播第一天热度破8000！连刷3集！我想说: 这部刑侦剧要火向全国

我去！郑钧的女儿也太美了，1：1复刻郑钧美貌，难怪郑钧更宠女儿

联想一体机漏洞被紧急修复，可绕过安全启动植入恶意软件

电讯报：曼联总价8500万欧报价塞斯科 曼联&纽卡都自认是球员首选

AI时代，寻找超级创业者！徐汇区发布政策扶持一个人赛过一群人的“大牛”

莱巴带伤轰16ACE击败张帅，新赛季目标再夺大满贯，小商取开门红

03年詹姆斯后 弗拉格将成为首位新秀赛季即参加圣诞大战的状元秀

大洗牌开启？医药代表管理办法出台，客情回扣模式或将终结

显瘦的夏日通勤搭配，复古又时髦！

OpenAI向美国政府提供ChatGPT企业版：每个机构每年1美元

微胖女孩冬天怎么穿衣？看看这27套冬季穿搭LOOK，保暖又显瘦

车企自建高速超充站第一，理想汽车现金储备达 1107 亿元

苍山遇难8岁男童妈妈首发声：涉事机构说到现在不赚钱

每体：球打到巴萨球员手臂就会判点；轮到皇马就要“解读”

该！买！包！了！30款绝美初秋包包！拿去！

杰克逊霍尔开幕：鲍威尔讲话在即，地区联储主席忙打“预防针”？

泽连斯基接受采访期间马林斯基宫两度停电俄官员回应

A股2025年分红额创历史新高分红次数居前上市公司名单一览

电讯报：曼联总价8500万欧报价塞斯科曼联&纽卡都自认是球员首选

03年詹姆斯后弗拉格将成为首位新秀赛季即参加圣诞大战的状元秀