8月20日消息,去年10月,智谱 AI 发布了全球首个可自主操作手机的产品 。这一产品曾帮助用户完成点咖啡、发红包等任务,被认为是 AI 应用的一次重要探索。今天,AutoGLM 再次升级,推出 AutoGLM 2.0,并迈出更具历史意义的一步——首次面向公众全面开放,无需邀请码即可使用。
据介绍,此次发布的 AutoGLM 2.0被定位为 “执行型助手”。过去的 AI 多停留在“对话”层面,只能回答问题;一般的 Agent 助手也多局限于信息查询和总结。AutoGLM 则实现了质的飞跃——它不再只是“说”,而是真正能够“做”,并且它能够在云端自主完成跨应用任务。
![]()
具体操作方面,在生活场景中,用户一句话即可让 AutoGLM 操作抖音、小红书、美团、京东等40余款应用,完成点餐、订票、查房、预约等服务。
在办公场景中,它也能跨应用执行完整流程,从检索资料到撰写文稿,再到生成视频、PPT 或播客,并直接完成发布。
据介绍,为支持这一能力,智谱为 AutoGLM 配备了专属云手机和云电脑,使其可以24小时独立运行。
这意味着 AI 可在后台持续执行任务,不占用用户设备,成为用户“平行世界”的搭子。智谱还将 AutoGLM 的执行能力封装为 API,并启动开发者生态计划,让其能力可以扩展至 AI 眼镜、手表、家电等硬件。开发者只需简单接入,AutoGLM 让硬件首次具备完整的 手机级操作能力,无需在端侧堆叠复杂系统或大容量电池。在智谱展示的 demo 中,可以直接通过 Rokid 智能眼镜点一杯咖啡。
技术上,AutoGLM 由智谱最新开源 SOTA 语言模型 GLM-4.5与视觉推理模型 GLM-4.5V 驱动,并结合端到端异步强化学习的多项创新。在 Device Use 基准测试 中,AutoGLM 的表现超过 ChatGPT Agent 和 Claude 4 Sonnet,被认为达到当前主流智能体的先进水平。(定西)
本文来自网易科技报道,更多资讯和深度内容,关注我们。
