关闭广告

AGI又进一步了?谷歌AI模型重磅更新 助机器人感知环境完成复杂任务

财联社2025-09-26 12:00:028人阅读

《科创板日报》9月26日讯(编辑 宋子乔) 当地时间9月25日,谷歌DeepMind专为机器人打造的AI模型系列Gemini Robotics更新,其研发团队推出Gemini Robotics 1.5和Gemini Robotics-ER 1.5,它们协同工作,构成了机器人的“执行和决策系统”。


“我们正在推动物理代理(an era of physical agents)时代的到来——使机器人能够感知、计划、思考、使用工具并采取行动,以更好地解决复杂的多步骤任务,新模型是里程碑式成就,标志着我们在解决物理世界中的通用人工智能(AGI)问题上迈出了重要的一步。”DeepMind表示,新模型加持的机器人可以主动了解周围环境,以通用方式完成复杂的多步骤任务。


据介绍,Gemini Robotics 1.5是谷歌目前性能最强的视觉-语言-动作(VLA)模型,能够将视觉信息和指令转化为机器人执行任务的运动指令。该模型在采取行动之前会进行思考,并展示其思考过程,可帮助机器人更清晰地评估和完成复杂任务。另外,该模型能将从一个机器人学到的动作迁移到另一个机器人,即帮助机器人相互“学习”,从而无需针对每类机器人专门定制模型,可大大提高机器人的泛用性和学习能力;
Gemini Robotics-ER 1.5是谷歌性能最强的视觉语言模型(VLM),擅长在物理环境中进行规划和做出逻辑决策,拥有先进的空间理解能力,能够以自然语言进行交互,预估机器人的成功率和进度,并且能够原生调用谷歌搜索等工具、创建详细的多步骤计划来完成任务。

具体操作上,机器人首先利用升级后的Gemini Robotics-ER 1.5模型理解其所处环境,并像人类一样使用谷歌搜索查找信息。随后,Gemini Robotics-ER 1.5会将搜索结果转化为自然语言指令,再交给Gemini Robotics 1.5模型,让机器人结合视觉和语言理解能力完成每一步操作。


该图展示了谷歌的具身推理模型Gemini Robotics-ER 1.5和视觉-语言-动作模型 Gemini Robotics 1.5如何在物理世界中执行复杂任务

谷歌近年来积极投身打造“机器人界的Android系统”。与早年自研机器人本体不同,谷歌现在希望通过提供强大的AI模型,让不同的机器人制造商采购,类似于安卓系统在手机行业的模式。据the verge报道,谷歌DeepMind机器人部门负责人卡罗琳娜•帕拉达(Carolina Parada)曾表示,其AI模型研发重点在于,使机器人能够在物理世界中采取行动之前“提前思考多个步骤”。

这种聚焦于AI模型的战略出发点与黄仁勋提出的物理AI理念类似。在机器人身上实现物理AI,可以理解为,机器人能够感知、理解现实世界,在此基础上与人进行交互并执行复杂的操作任务。

AI模型作为机器人的“脑子”,在此过程中至关重要。8月25日,英伟达推出新一代专为物理AI和机器人开发者设计的计算平台Jetson Thor。英伟达表示,这款全新的机器人计算机将成为科研与工业领域机器人系统的“大脑”。

《科创板日报》此前报道过,当前估值第一的机器人初创公司Figure自主研发了端到端机器人AI模型Helix,该模型可让机器人直接将视觉语言模型中捕获的丰富语义知识转化为动作;Dyna Robotics日前接受了英伟达等的投资,该公司目前正研发用于帮助机器人在现实场景中学习和提升能力的AI模型,其CEO Lindon Gao表示,Dyna不会为机器人编写任务指令,而是让它们通过从环境中获取的数据输入逐渐学习,“我们的最终目标是解锁物理AGI”……

这些科技巨头、明星初创公司的动作预示着机器人行业发展必然趋势——以自研AI模型打通AGI之路。

中金公司日前发布研报称,未来仅有少数具备全栈能力的机器人企业,有望进一步突破至“具身智能”层级。该机构认为机器人大模型是破解传统机器人控制瓶颈、迈向通用具身智能的关键路径。当前行业主要基于大语言模型、自动驾驶大模型及多模态大模型探索的发展方向,产业重心已转向“小脑+大脑”系统研发,而不同企业在研发与商业化路径上存在差异。只有极少部分具备全栈技术能力、资源整合优势与长期主义战略的企业,未来将通过收敛技术路径,最终定义“具身智能”的核心标准,进一步突破至“具身智能”层级。

华泰证券也表示,本轮具身智能热潮起于大模型的技术突破,大模型决定了人形机器人泛化能力的天花板,是现阶段商业化的核心壁垒之一。当前众多科技大厂入局赛道,如谷歌、OpenAl、Meta、英伟达等均在布局大脑,国内大厂虽然布局稍晚,但已有成型产品,如华为、百度、科大讯飞等,同时涌现出一批优秀初创公司,试图打造机器人“通用大脑”,以及Figure Al为代表的全球头部人形机器人创企开始自研基础大模型。这会加速行业进入淘汰赛,不具备一定AI能力的本体厂或被挤压生存空间。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普:泽连斯基愿放弃克里米亚

财联社 浏览 1345 04-29

斯基拉:尤文提高对蒂莫西-维阿的要价导致球员经纪人不满

懂球帝 浏览 1203 07-28

12.29万起 艾瑞泽8 PRO 2.0T要做国产最强2.0T

网易汽车 浏览 6567 06-23

特斯拉的“后发制人”:Model Y L和Model 3+能否扭转颓势?

极智动力 浏览 920 07-30

官方回应"孕妇遭两男子殴打住院":一打人者系公职人员

扬子晚报 浏览 9532 07-16

Karpathy都投的AI实时视频生成模型:直播立即转,无限时长零延迟

量子位 浏览 9604 07-20

25岁中国翼装飞行博主在意大利身亡 好友透露事故细节

极目新闻 浏览 2142 08-09

莱万:哈维深爱着巴萨,因为他的贡献俱乐部才有了今天

懂球帝 浏览 9153 08-14

这两款车,“爆”了又没完全“爆”

第一财经资讯 浏览 352 08-04

阿里发布Q1财报:收入超2476亿元,“AI+云”板块超预期加速增长

红星资本局 浏览 27 08-30

特朗普:8月1日起对进口半成品铜等产品征收50%关税

央视新闻客户端 浏览 9339 07-31

推广|| 不到百元就能安心过夏天,在这个价位里它真的没啥对手!

黎贝卡的异想世界 浏览 7621 05-24

特斯拉车祸,被判赔偿超 2 亿美元;传 OpenAI 将推 10 美元「亲民订阅」;影石刘靖康:祝贺同行大疆推全景相机

极客公园 浏览 5084 08-03

宗庆后三弟全家美籍负责在美资产 杜建英小儿生父存疑

蓝鲸新闻 浏览 4880 07-18

硕士博士大扩招,考研人数却暴跌50万,什么信号?

智谷趋势 浏览 775 08-10

章宇任素汐是绝配,曼谷街头演绎楚门世界,分手闹剧撞上真人秀

最爱酷影视 浏览 3395 07-11

挽救赛点!王欣瑜2-1抢七逆转进八强 不满争议判罚拒与裁判握手

醉卧浮生 浏览 2630 07-24

Waymo前CEO质疑特斯拉Robotaxi:车内有人就不算自动驾驶

IT之家 浏览 7350 08-18

每体:拉波尔塔与德科共进午餐,商讨所有转会事宜并作出最终决定

直播吧 浏览 28 08-22

东方甄选否认前CEO孙东旭离职;阿里巴巴重新归纳4大部门丨邦早报

创业邦 浏览 46 08-23

美媒:哈梅内伊目前藏身地堡避险 已暂停电子通信

红星新闻 浏览 2887 06-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3