快斗优选

当地时间7月17日，OpenAI推出ChatGPT智能体（ChatGPT agent），整合早期三项突破性进展，让具备思考与行动能力的智能体连接研究与实践。

ChatGPT智能体可以分析竞争对手并制作幻灯片，也可以计划并采购4人份早餐的食材。OpenAI CEO山姆·奥特曼表示，看着ChatGPT智能体借助计算机完成复杂任务，对他来说是一个“感受通用人工智能（AGI）”的瞬间，“那种看着计算机思考、规划并执行任务的感觉确实与众不同。”

不过他也提到，ChatGPT智能体的潜在风险也不容忽视，“如果向家人解释这款产品，我会说它处于技术前沿，尚属试验阶段。这是一个体验未来的机会，但在我们通过实际应用研究并改进它之前，不建议用于高风险场景或涉及大量个人信息的场合。”

具备思考与行动能力，用户可随时中断任务

如今的ChatGPT具备思考与行动能力，能主动从一系列工具库中选择合适工具，为用户从头到尾处理复杂任务。例如它可以查看日程表并结合近期新闻为用户简要介绍即将到来的客户会议、分析三家竞争对手并制作幻灯片。ChatGPT会智能浏览网站、筛选结果、在需要时提示用户安全登录、运行代码、开展分析，甚至生成可编辑的幻灯片和电子表格来汇总其研究成果。

它能帮助用户规划并预订旅行行程、设计并安排整场晚宴、计划并采购4人份早餐的食材。它还能借助ChatGPT连接器让用户关联Gmail、Github等应用，这样就能找到与用户提示词相关的信息并用于回应。用户也可以通过接管浏览器在任意网站登录，从而让它在研究与任务执行中探索得更深、范围更广。总之，它可以在访问和交互网页信息中选择最优路径、高效完成任务。

ChatGPT可以通过自身虚拟计算机执行这些任务，在推理与行动之间流畅切换，根据用户的指令处理复杂流程。最重要的是，控制权始终在用户手中。ChatGPT在执行重要操作前会请求许可，用户随时可以中断任务、接管浏览器或停止任务。

OpenAI表示，这些新功能的核心是一套统一的智能体系统。它整合了早期三项突破性进展的优势，即Operator智能体的网站交互能力、深度研究（deep research）智能体的信息整合能力以及ChatGPT本身的智能与流畅对话能力。

此前，Operator与深度研究各自具备独特优势，Operator能够在网页上滚动、点击和输入，深度研究则擅长分析与总结信息。两者的优势场景各有侧重，Operator无法深入分析或撰写详细报告，深度研究则无法与网站交互以优化结果，也无法访问需要用户身份验证的内容。因此，OpenAI将两者的优势融合在一起。

基准测试表现优异，潜在风险不容忽视

目前，ChatGPT智能体在基准测试中的性能表现优异。在“人类的最后考试”（Humanity’s Last Exam）这项通过广泛学科的专家级问题评估AI性能的测试中，ChatGPT智能体取得41.6的“单次通过率”（Pass@1 SOTA）新纪录。由于智能体动态规划并自主选择工具，面对同一任务时可在不同运行过程中采用多样解法，因此OpenAI通过并行策略扩展测试时，智能体得分进一步提升至44.4。

ChatGPT智能体在“人类的最后考试”中的表现。

FrontierMath是目前已知难度最高的数学基准测试，以未发表的新颖问题为特色，即便是专业数学家往往也需要数小时乃至数天解出。在该测试中，通过终端执行代码等工具，ChatGPT智能体的准确率达到27.4%，大幅超越以往的各类模型。

DSBench旨在评估智能体处理涵盖数据分析与建模的真实数据科学任务的能力。ChatGPT智能体在该测试中的表现显著超越人类水平。例如在DSBench的数据分析测试中，人类得分64.1%，ChatGPT智能体得分89.9%。

ChatGPT智能体在DSBench的数据分析测试中的表现。

即日起，Pro、Plus及Team用户可在任何对话的任意环节，选择“智能体模式”，直接激活ChatGPT的智能体功能。不过，OpenAI表示，尽管ChatGPT智能体已是处理复杂任务的强大工具，但今天的发布只是一个开始。OpenAI将持续迭代，定期推出重大改进，让它逐渐具备更强能力，为更多人提供更实用的帮助。

奥特曼也表示，尽管这款产品的实用性显著，但潜在风险也不容忽视。OpenAI内置了大量安全防护机制和警示功能，并从鲁棒训练、系统防护到用户控制部署了比以往任何时候都更全面的风险缓解措施，但无法预见所有可能的情况。本着迭代部署的原则，OpenAI会向用户发出充分警示，同时允许用户在谨慎考量后自主决定是否采取行动。“如果向家人解释这款产品，我会说它处于技术前沿，尚属试验阶段。这是一个体验未来的机会，但在我们通过实际应用研究并改进它之前，不建议用于高风险场景或涉及大量个人信息的场合。”

ChatGPT智能体上线，奥特曼：感受到AGI的瞬间，但风险不可忽视

国内成品油：...

几毛钱的芯片...

下一代GPU...

欧尔班：乌克...

BBC：埃弗...

高以翔离世6...

程帅澎20分获MVP：轰5三分平约旦全队三战46+10三分成头号射手

陈道明和陈宝国，为何集体退场？

达成协议！加拿大航空业罢工结束

＂俄罗斯院士＂33亿元投资闹剧自称花了8年删网上资料

国盾量子董事长吕品去世：上任半年多年仅46岁

谁能“扶起”智界汽车

贾跃亭携手魏牌：内销转出口，开赚老外钱

上海发布重磅文件，事关具身智能

最高法发布司法解释：劳资双方不缴纳社保的约定，无效！

从超模到胖到认不出，于娜用12年证明：健康比瘦重要一万倍！

许我耀眼结局：沈皓明坦白离婚，沈金松被免职

10位院士与会 2025中国自动化大会成功举行

知名女演员突发声明！剧方道歉：已开除涉事人员

世体：切尔西向费尔明保证他会是球队主力，给球员48小时做决定

苹果的“利润结构”正发生重大变化，美银：这是支撑股价的理由

湖南52岁无臂大姐瞒着儿子学跆拳道夺得全国冠军

短剧版《小巷人家》，为什么难成下一部《父母爱情》？

美开应答机运核武器俄准备全面对抗

新不如旧！这4件时髦“旧衣服”今年太火了

标配高速NOA 方程豹钛3后驱版5月20日交付

伊姐周日热推：电影《坏蛋联盟》；综艺《花儿与少年·同心季》......

50+女性秋冬穿搭指南，4个让年龄法则成为加分项，越穿越优雅

内塔尼亚胡就袭击卡塔尔事件向卡方道歉

李斌、李想，看上了同一块蛋糕