关闭广告

机器人界「Imagenet时刻」李飞飞团队官宣全球顶级具身智能挑战赛

机器之心Pro2025-09-24 12:00:0272人阅读



在计算机视觉的历史上,Imagenet 挑战赛曾被誉为 AI 发展的分水岭,引爆了深度学习的浪潮。那么,在具身智能与机器人领域,是否也会迎来类似的 “拐点时刻”?

答案或许渐渐清晰。李飞飞团队与斯坦福 AI 实验室正式官宣:首届 BEHAVIOR 挑战赛将登陆 NeurIPS 2025。这是一个为具身智能量身定制的 “超级 benchmark”,涵盖真实家庭场景下最关键的 1000 个日常任务(烹饪、清洁、整理……),并首次以 50 个完整长时段任务作为核心赛题,考验机器人能否在逼真的虚拟环境中完成真正贴近人类生活的操作。



为什么 BEHAVIOR 值得关注?

与以往碎片化的基准不同,BEHAVIOR 首次提出:一个真正的家庭机器人,必须同时具备跨房间导航、双手精细操控、长期规划与动态适应等多项能力。

任务规模前所未有:覆盖 1000 个家庭活动,50 个完整长程挑战,平均单个任务需要 6.6 分钟连续操作。

  • 高保真环境仿真:基于 NVIDIA Omniverse 的高保真模拟器 OmniGibson,支持衣物折叠、液体倒水、加热 / 冷冻等复杂物理交互。



  • 数据史无前例:10,000 条专家遥操作示范,总计 1,200+ 小时,细致标注物体状态、空间关系和自然语言描述 —— 为模仿学习和强化学习提供 “黄金数据集”。



  • 平台统一:采用星海图 R1 Pro 机器人作为默认机器人本体,双手协调与稳定导航能力让研究成果更具可迁移性。



这不仅是一个挑战赛,更是有史以来最全面的具身智能研究资源。

挑战赛怎么玩?

  • 赛题:完成 50 个 BEHAVIOR 任务,均来自真实家庭场景的复杂活动。
  • 平台:统一使用星海图 R1 Pro 本体(双手操作 + 轮式移动),保证研究成果具备可迁移性。
  • 基准方法:官方提供模仿学习(ACT、Diffusion Policy 等)与视觉语言行动模型(OpenVLA、π0)的完整训练评估流程,帮助选手快速入门。

评估标准:

  • 主要指标:任务成功率(完全达成 vs 部分达成)。
  • 辅助指标:效率(用时、路径、动作)、数据利用率(示范数量 vs 成效)。

时间线:

  • 2025/9/2:开放报名与数据下载,进入开发与公开排行榜阶段。
  • 2025/11/15:最终评估,隐藏测试集统一运行。
  • 2025/12/6-7:NeurIPS 2025 公布结果与获奖方案。

奖项虽不高(最高 1000 美元),但真正的价值在于能在 NeurIPS 舞台与全球顶尖团队交流、展示。

https://behavior.stanford.edu/

你可以在这个网站中找到安装 OmniGibson 仿真器、下载 3D 场景资源和物体模型、加载示范数据集的详细指南,网站还提供了入门套件,其中包含示例训练脚本和评估例程,方便重现基线结果,并在此基础上进一步发挥创新。

此外,文档中详细介绍了如何设置环境、如何使用机器人控制接口以及如何可视化任务执行流程,力求让你尽可能轻松地开始开发自己的解决方案。

如果你是具身智能的新手,也不用担心:BEHAVIOR 挑战提供了从仿真器设置到提交结果的详细教程和分步指南。非常期待看到全球各团队如何运用创意来应对这些任务!

一场属于具身智能的集体实验

BEHAVIOR 挑战赛并非单纯的排行榜竞争,而是一次面向核心科学问题的集体实验:当前的具身智能发展距离真正能独立完成以人为本的家务任务还有多远?机器人在新环境中能否举一反三,实现跨场景泛化?而当我们不断扩大示范数据规模时,是否会像语言和视觉领域一样,出现推动性能跃升的 “扩展率”?这些悬而未决的问题,正是 BEHAVIOR Challenge 希望通过开放赛题和大规模数据来共同探索的。

结语

从语言模型到视觉模型,AI 领域已经走过多个 “Imagenet 时刻”。而现在,具身智能正在迎来自己的里程碑。

BEHAVIOR 挑战赛既是一次学术竞技,也是一场社区实验。它不仅考验算法性能,更推动研究者集体探索:要让机器人真正走进人类生活,还差什么?

数据已开放,任务已就绪,机器人正严阵以待。

这一次,我们也许真的离 “家庭机器人” 更近了一步。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

超过上海,重庆冲成消费第一城

华商韬略 浏览 2704 08-13

"家居零售教父"汪林朋坠亡 湖北政商界今年已多人被查

第一财经资讯 浏览 6880 07-29

张柏芝不再隐瞒,三胎生父早有答案?

石场阿鑫 浏览 23 12-23

董卿母子现身看电影,13岁儿子身高超160

娱乐圈圈圆 浏览 36 12-02

辽宁85-79北控迎4好消息!王岚嵚+张陈治锋证明自我,付豪稳输出

篮球资讯达人 浏览 75 09-25

联通发布车联网创新成果 涵盖汽车出海、工厂无人驾驶驳运

北青网-北京青年报 浏览 8787 07-20

业绩承压下的豪赌:时空科技跨界收购存储芯片厂商嘉合劲威

国际金融报 浏览 43 10-25

周杰伦换台,短视频进入“细糠”时代

价值星球Planet 浏览 5425 07-31

太阳报:前狼队前锋起诉医生,他认为该医生毁了他的职业生涯

懂球帝 浏览 4764 07-19

奥迪全新RS6 Avant被发现在西班牙路测 空力套件盖不住

CLauto酷乐汽车 浏览 732 07-14

成都车展大SUV“贴身肉搏”,纯电混动多路玩家谁将“上主桌”?

时代财经 浏览 85 09-01

极摩客EVO - T2迷你主机亮相:本季度上市,配置强大

IT之家 浏览 19 01-07

300万中产宝妈,买出一个IPO

豹变 浏览 64 09-29

选来选去还是这些穿搭最适合夏天!不老气横秋,舒适又大方

静儿时尚达人 浏览 8914 07-09

理想、中国汽研正式声明!

电动知家 浏览 5189 08-04

天弘余额宝首次降费,每年“省下”8000万元,货币基金降费大幕已开启

界面新闻 浏览 66 09-24

其实,零百加速5秒的新规才是利好车企

速度计 浏览 45 11-17

6万人欢呼!西蒙尼带队狂飙:儿子助攻 西甲4场10分杀进前4

叶青足球世界 浏览 55 10-19

观察|国产算力从单点突破转向系统级创新,厂商齐推超节点,“光”迎来了高光时刻

澎湃新闻 浏览 7641 07-30

"被家暴16次"女子:前婆婆被撤销上诉 对方应返还91万

扬子晚报 浏览 10033 07-18

午评:沪指半日跌0.68% AI硬件、创新药概念股再度大涨

网易财经 浏览 2074 07-31
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3