快斗优选

作者：高藤

原创：深眸财经（chutou0325）

28日晚，许多人都在关注的第 66 届国际数学奥林匹克竞赛（IMO）公布了比赛结果。

中国队不出所料地夺得头筹，斩获6 枚金牌。其中更是有两位同学获得满分，以231分的团队总成绩碾压全场。

对于这一已经预料到的结果，网上反应比较平淡，引发热议的反倒是另一个赛道的OpenAI。

01 OpenAI“抢跑”背后的幻像

在用于评估AI大模型在数学竞赛表现的MathArena.ai平台上，对当前最顶尖的AI公开大模型进行了测试

OpenAI的o3与o4-mini、谷歌的Gemini 2.5、马斯克家的Grok-4以及国产DeepSeek-R1等顶流AI模型全部出战。

遗憾的是，AI大模型在这届IMO上全军覆没。

在这场比拼中，得分最高的是谷歌Gemini 2.5拿到13分，也就是31%的分数，连铜牌都够不上。

就在大家纷纷认为这就是目前AI的上限时。

OpenAI团队带着最新开发的通用推理模型，抛出了一颗重磅炸弹：

在与人类完全相同的考试条件下作答，最终解出5道题，共获得35分，达到IMO金牌分数线，成功拿到了金牌

但事实真的是这样吗？

首先引发大家争吵的就是消息发布的时间。

按照IMO的规定，所有成绩都应该在IMO闭幕的一周后再发布。

结果当地时间19日下午5点43分，闭幕式一结束，5点50分OpenAI的官方就发布了“AI刚好压过金牌线”的消息。

七分钟之差，既让OpenAI钻了规定的空子，还先其他参赛选手一步，在网络上掀起了轩然大波。

这一行为让不少网友为其他真实竞争对手打抱不平，毕竟抢跑的行为，本身就是对竞争对手的不尊重。

其次就是，金牌是谁认证的？

虽然官方一直说的都是“OpenAI压上了金牌及格线”，但不少媒体为了省事，直接写成“AI夺得金牌”。

此外，OpenAI并未接收到任何参加IMO的邀请，更不用说究竟是谁给AI评出的35分好成绩。

这就相当于自己在家里做了一套高考真题，对照答案评分后，得出了一个我是高考状元，能上清华的结果。

国外有OpenAI以“夺冠”炒作，国内也有AI写高考作文吸睛。

今年高考语文考试一结束，各大AI公司迫不及待地让自己的AI助手开始考试。

豆包、腾讯元宝、天工……一共16款产品，都在网上发布了自己写的作文。

面对AI写出来的作文，不少人站出来说“我觉得AI比我强”。

每每在这种测评的关键时刻，AI都会以出色表现“出圈”。

但到了生活中，AI假大空的想法、胡乱编造的数据、古今中外虚实大乱炖的文章模板，甚至连AI造假的事也层出不穷。

就算这样，AI的使用率仍在不断增长。

从学生用AI代写论文，到上班白领依赖AI生成报告，再到媒体行业机器人撰稿占比突破40%，人类正经历一场前所未有的“思考能力危机”。

02 思维惰性引发认知陷阱

AI写高考作文、压线夺冠，每一次“出圈”都像是精心策划。

抛开网络上营销号对AI的呼声，值得让我们思考的并不是AI会不会代替人类，而是我们总是习惯把思考的机会全部甩给AI，自己坐享其成。

以Cision发布的《2025全球媒体调查报告》为例，通过对19个国家3,126名记者的调研发现，53%的记者已在工作中使用生成式AI工具。

在其他使用AI进行辅助的领域中，教育行业首当其冲：

国内的某高校调查显示，使用AI辅助学习的学生中，仅28%能独立完成复杂逻辑推导，较五年前下降45%。

神经可塑性研究表明，长期依赖AI会导致大脑神经网络重构，前额叶的决策区域活跃度下降20%，视觉皮层的信息处理区域却变得异常活跃。

换句话说，使用AI大量处理认知工作，会让工作者参与创新所需的深层分析的过程大幅减少，思维出现"断片"现象，产生认知依赖症。

还会缩小人脑思考和机器思考之间的差距，弱化原创观点和创造性方法所带来的价值。

除此之外，过度相信AI的建议，可能会失去辨别能力，导致错误信息风险增加。

AI之所以能够高效产出内容，就是因为它直接搬运或者套用海量数据库中的表面规律，但却不会主动核实事实。

2023 年，纽约市协助政府服务的AI 聊天机器人，建议企业主扣除员工消费来获利，但真实的法律却明确规定了老板不能扣取员工的小费。

再比如，政策明确规定企业必须接受现金，不得歧视没有银行账户的客户。但是AI 却说“餐厅可以不提供现金付款选择”。

在面对具有信息变量的情况下，尤其是在涉及多变量分析时，AI就可能生成看似专业但逻辑不自洽的内容。

如果不仔细甄别，这种“幻觉”现象不仅会误导用户，增加错误信息的风险，还可能引发信任危机。

所以说，AI使用率的不断提高已成必然，但我们该做的不仅是改进算法，让人工智能更好的服务人类，而是如何才能在享受便利和坚守认知之间找到平衡。

03 以AI治理AI

首先，利用AI自身的算法能力，来监管、优化和安全应用AI技术。

我们常见的AI主要分为，基于模板的自动化生成，和基于深度学习技术的自动化生成，这两种类型。

而训练AI的原材料就是数据。

以Open AI的第一个大模型GPT1为例，它有1.17亿个参数，到了GPT2，有15亿个，而GPT3则增长到了1750亿个，GPT4的参数更是达到令人震惊的1.8万亿个。

巨大的参数数量决定了AI模型如何对输入数据做出反应，从而决定模型的行为。

将AI的行为举止具象化，可以增进用户对AI技术的理解，识别其潜在的偏差，有助于平衡用户对AI的信任度和依赖度。

其次，还可以利用AI技术研究用户的心理机制，成果可以作为改进AI模式的参考，避免引发引发过度依赖。

AI技术通过自然语言处理和情感计算，能够实时分析用户的语言、语音和行为模式，识别潜在的心理健康风险。

例如养老院使用机器人，通过声波震颤识别老人的孤独指数，辅助早期筛查抑郁倾向。

在过度依赖AI的防控上，同样可以运用它的算法，通过分析用户的使用频次、情感表现、面部表情等，来提供特定的“AI戒断”方法，降低用户的依赖程度。

结语：AI的发展已成必然，频频“出圈”的背后不再只是算法的精进，还有认知主导权的易主。如何在技术狂欢与认知危机交织的时代始终保持警惕，避免沦为算法的附庸，才是人类驾驭科技的关键。

从IMO「抢跑」到AI「幻觉」：技术狂欢下的认知陷阱

金·卡戴珊抵...

为打造本地生...

底价只需1元...

游客在大理＂...

怒撕S家后，...

酉立智能：研...

锁定季后赛，迈阿密国际中场德保罗晒海报纪念这一时刻

美媒揭美军37小时奔袭伊朗细节

王心凌吴克群暧昧19年爆热恋1年内飞4地约会

中国市场缺席，特斯拉将 FSD 转移促销计划扩展至欧洲及中东地区

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

德央行行长妄言：若报复中国是最后一招那就干票大的

卡扎菲儿子被暗杀身亡：4名蒙面人员闯入住所激烈交火

荀玉根：如何理解股强经弱？

预计今年秋季发布享界全新越野SUV谍照曝光

郑丽文要让国民党＂羊群变狮群＂：不是反咬一口而已

委内瑞拉代总统：我“受够了”来自华盛顿的命令

A股后续还能涨多久？专家分析解读

黄奕12岁女儿想去韩国当爱豆，网友纷纷劝阻，颜值成其最大限制

大鹏白客新剧同台飙戏！一个曾血本无归，一个因社保出道，太真实

1家3口被同村村民杀害丈夫将带妻子被砍断的头发听审

巴基斯坦与印度互相驱逐对方一名外交官

杨采钰获男友力挺！大方晒出背影照秀恩爱，男闺蜜火速送祝福

预售权益价10.69万元起东风日产N6将上市

特朗普：普京已经厌倦了他们都厌倦了

今年冬天最经典的4双鞋，年年穿都好看！

涉伊核机密情报再泄露白宫急了

逆风中打造「清欢节」：年销10亿的卸妆油女王，为何要用5年圈定10万核心用户？| 思路说vol.26

短债高峰来了：美国财政部本周拟创纪录发行千亿四周期国债

F4《流星花园》美女童星长大了，晒周渝民旧照，希望大S可以看到