关闭广告

AI能力新高度!OpenAI发布ChatGPT智能体:能自主选择工具完成任务

澎湃新闻2025-07-18 12:00:016425人阅读

ChatGPT可以自主调用电脑资源执行任务了。

当地时间7月17日,人工智能(AI)巨头OpenAI推出ChatGPT智能体(Agent)系统,OpenAI CEO山姆·奥特曼(Sam Altman)和四位负责人进行了25分钟的直播。

据介绍,这是一套融合Operator远程浏览器执行能力、Deep Research网络信息整合技术以及ChatGPT对话优势的统一智能体平台,“可以思考和行动,能够主动从代理技能工具箱中进行选择,使用自己的计算机为您完成任务”。

奥特曼表示,智能体代表了AI系统能力的新高度。


此前,Operator和Deep Research各有优势:Operator可以在网页上处理内容,而Deep Research则擅长分析和汇总信息。但Operator无法深入分析或撰写详细报告,而Deep Research无法与网站互动以优化结果或访问需要用户身份验证的内容。此次,OpenAI直接将两者的优势进行了结合。

ChatGPT在Agent模式中会使用自己的“虚拟电脑”执行任务,基于用户指令处理复杂的工作,用户可以主动与网站互动,或在同一聊天中直接从对话过渡到直接请求操作。

在发布会上,OpenAI演示了用ChatGPT Agent同时进行买西装、做贴纸、订酒店等任务,Agent使用数秒启动虚拟电脑后便会询问用户明确需求,再进行衣服的挑选,Agent会滑动网页、点开商品详情,并留下相应的建议文字。此外,Agent也可以代替用户进行下单操作。


在“虚拟电脑”中,即使ChatGPT使用多种工具,也能保留任务所需的上下文,模型可以选择使用文本浏览器或可视化浏览器打开页面,从网络下载文件,通过在终端中运行命令进行操作,然后在可视化浏览器中查看输出。

同时,ChatGPT在执行重要操作之前会请求权限,用户可以随时中断、控制浏览器或停止任务。用户也可以安排已完成的任务自动重复,比如每周一早上生成每周报告。

在“人类最后一次考试”评估中,ChatGPT agent模型的SOTA(State of the arts,领域内最高水准)得分达到了41.6,当采用简单的并行部署策略(一次最多运行八次尝试,并选择自评置信度最高的一次)进行扩展时,得分提升至44.4。

此外,在FrontierMath等基准测试中,ChatGPT Agent的准确率也远超之前的模型。


Pro、Plus和Team用户可以使用Agent模式。企业版和教育版用户将在未来几周内获得访问权限。目前Pro用户每月有400次使用次数,其他付费用户每月有40次使用次数,也可以付费获得更多使用量。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

倒计时?勇士国王重启库明加先签后换谈判 资质报价时间即将到期

醉卧浮生 浏览 21 09-25

详细分析:为什么今年美网后,德约科维奇很有可能退役?

网球之家 浏览 1468 07-22

现在的人,怎么还没20年前会穿啊

时尚COSMO 浏览 9403 07-17

30岁后越来越美的女人,只穿滋养自己的衣服

LinkFashion 浏览 46 09-20

吸金能力惊人!美国诞生又一千亿美元AI巨头,2027年要超越OpenAI

智东西 浏览 1908 07-19

牛弹琴:印度宣布重大消息 震动了全世界

映象网 浏览 2805 08-10

200万骑手大军成胜负手,美团阿里为抢人杀红眼

晚点LatePost 浏览 7645 07-24

采用增程式动力 奇瑞风云X3L正式亮相

车质网 浏览 7165 07-22

宝藏BOSS冯擎峰:是CTO,也是CEO

网易汽车 浏览 3 10-27

Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新

量子位 浏览 3203 08-06

彭博社:印度人耿耿于怀之际 发现特朗普不敢欺负中国

澎湃新闻 浏览 9154 08-09

小鹏汽车9月交付超4万台同比增长95% 推国庆限时补贴

网易汽车 浏览 22 10-02

百度聚焦,心响失宠

字母榜 浏览 9035 07-31

龚俊《暗河传》首波口碑出炉了!现场观众的评价“一针见血”

娱乐圈笔娱君 浏览 15 10-21

蔚来年底盈利:超越短期目标,重塑自己的竞争力

百姓评车 浏览 20 10-21

登贝莱:欧冠决赛中注视索默的动作?其实是我太累了在休息

懂球帝 浏览 25 09-25

汪小菲带子女回内地见张兰,小S全家出游独留S妈伤感,差距太大!

萌神木木 浏览 2135 07-15

洪九果品响退市警报,“榴莲大王”梦断资本路

斑马消费 浏览 15 10-16

伊朗官员:击落一架MQ-9"死神"无人机

环球网资讯 浏览 221 06-17

杨振宁获诺奖速度纪录至今未破 提出理论到获奖仅1年

澎湃新闻 浏览 16 10-19

2.3T柴油/智能化配置 威麟R08预售8.88万起

网易汽车 浏览 37 08-30
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3