关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:011855人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%~44%。


Vidar在VBench视频生成测试中,在主体一致性、背景还原与画面质量等维度均显著领先。结合测试时扩展机制(Test-Time Scaling),模型可根据具体任务智能调节生成预测,进一步提高真实场景下的执行稳定性。

研究团队表示,Vidar打破了现有VLA架构对特定机器人任务数据的依赖,首次构建了“通用视频-中等具身视频-少量本体数据”的三级训练框架,推动了具身智能向“虚实互通”的下一阶段演进。未来,Vidar可广泛应用于居家、医院、工厂等场景。

生数科技创始人兼首席科学家朱军教授表示:"我们致力于通过多模态大模型技术推动数字世界与物理世界的深度融合与协同进化。一方面,我们正在打造新一代数字内容创作引擎,让AI成为人类创意的延伸;另一方面,我们通过训练具身视频基座模型,实现虚拟与现实的深度交互。"(袁宁)

本文来自网易科技报道,更多资讯和深度内容,关注我们。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

分羹法拍房!富滇银行落地首笔“法拍贷”,曝五部门全程配合

密探财经 浏览 20 09-29

奇瑞品牌大整合,成立“新四大”事业群

汽车公社 浏览 900 07-08

中国女孩在巴厘岛疑食物中毒去世 还有人上吐下泻晕倒

扬子晚报 浏览 44 09-24

阶跃星辰与“中国英伟达”们成立联盟,今年冲刺10亿元收入

南方都市报 浏览 4193 07-28

赵昭仪“叮铃桄榔”系OOTD又加更了

时尚COSMO 浏览 7429 07-07

"小白鞋过时了!今秋最火的是这4双鞋,百搭显瘦还偷偷增高

Yuki女人故事 浏览 42 09-12

从月销十万,到年销400万:零跑好大的口气

驾仕派 浏览 27 09-11

“容嬷嬷”年轻时竟是校花?照片太惊艳了!

邵阳县融媒体中心 浏览 5660 07-13

我国科学家在催化反应中实现近100%的贵金属原子利用率

新华社 浏览 40 09-26

此路不通?泰晤士报:以防曼城买,纽卡打算与利夫拉门托续约六年

直播吧 浏览 4338 07-22

造假被罚7620万 8家基金踩雷这家减肥药企

网易财经 浏览 1764 07-23

争夺品牌商家,速卖通要跟亚马逊以小博大

观察者网 浏览 19 09-25

京东重磅宣布:投入超100亿元!

中国基金报 浏览 2826 08-09

山姆超市回应"冷冻2年的西兰花":冷冻锁鲜 可放心食用

极目新闻 浏览 40 09-21

高德地图:全球化打车新增4国 累计扩至30国

网易科技报道 浏览 68 08-30

鲁杰里:与格列兹曼小蜘蛛并肩作战很激动 西蒙尼是世界级教练

直播吧 浏览 9052 07-21

材料学新突破,科学家在陨石中发现奇异矿物

网易科技报道 浏览 1105 08-14

Shams:据我所知 有多支球队目前都在等待字母哥做决定

直播吧 浏览 5211 08-05

长这样的外套,大骨架女孩不要买!

Yuki女人故事 浏览 11 10-23

实测百公里油耗2.08L 风云A8新车型上市7.99万起

网易汽车 浏览 1991 06-06

破防!冲场球迷怒斥C罗:后悔花2999元看球,更后悔支持伪君子

念洲 浏览 55 08-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3