关闭广告

谷歌Genie 3官宣:一句话生成3D世界,但普通人还玩不上

网易科技报道2025-08-06 12:00:02805人阅读

8月6日消息,DeepMind近日发布了其AI“世界模型”(world model)的新版本 3。 该模型能够基于用户提示词,实时生成可供用户及AI智能体(AI agent)进行互动的3D环境。据谷歌介绍,Genie 3在互动时长和场景记忆的连贯性上,均较前代版本有显著提升。

世界模型是一种可以模拟环境的AI系统,其应用场景包括教育、娱乐以及机器人或AI智能体的训练。与传统视频游戏依赖3D资产手动构建世界不同,世界模型完全由AI根据提示词生成可供用户探索的空间。谷歌正大力投入该领域,不仅在去年十二月展示了可基于图片生成互动世界的Genie 2,目前还在组建一支专门的世界模型团队,该团队由OpenAI视频生成工具Sora项目的一位前联合负责人领导。

根据谷歌发布的一篇博文,Genie 3在核心性能上实现了多项关键迭代。其生成的互动世界,可支持“数分钟”的连续互动,相比Genie 2仅能实现的10至20秒互动时长,有了大幅提升。

此外,新模型增强了场景的“物体恒存”能力。谷歌表示,Genie 3能将空间在视觉记忆中保持约一分钟。这意味着,当用户在虚拟世界中将视线从一个物体上移开再转回时,墙上的油漆或黑板上的字迹等细节将保持原位,不会发生意外的扭曲或变化。技术规格方面,Genie 3生成的世界将拥有720p的分辨率,并以24fps的帧率运行。

DeepMind还在Genie 3中加入了一项名为“可提示化世界事件”(promptable world events)的新功能,允许用户通过提示词,直接改变世界中的天气状况或添加新的人物角色。

然而,Genie 3在发布初期将不会向公众开放。 谷歌方面称,该模型将首先以“有限研究预览版”的形式,提供给“一小部分学者和创作者”使用,以便其开发者能更好地理解潜在风险并制定适当的缓解措施。

目前,该模型仍存在一些限制,例如用户与生成世界的互动方式有限,以及清晰可读的文本“通常只有在输入的提示词描述中提供时才能生成”。谷歌表示,公司正在“探索”未来如何将Genie 3提供给“更多的测试者”。(易句)

(本文由AI翻译,网易编辑负责校对)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

状态不佳,阿森纳对阵森林上半场8脚射门0射正

懂球帝 浏览 82 01-18

四年减少771万!稳出生人口,要加力了

西部城市 浏览 76 01-20

印度与俄罗斯宣布:加强稀土合作

参考消息 浏览 1924 08-09

一块布卖1299元!苹果新配件冲上热搜,网友怒怼智商税

雷科技 浏览 111 11-12

稳增5.6%!武汉GDP站稳2.2万亿

虎投邦 浏览 59 02-04

国联民生获批交易权牌照 点燃中型券商“落子”香港热情

21世纪经济报道 浏览 129 10-10

众泰汽车重组出现变数?

车业杂谈 浏览 65 02-04

韩硕辞职后首战!新疆42分狂胜送四川18连败 齐麟复出11分

醉卧浮生 浏览 85 01-23

双料影后龚雪:曾风光无限 被迫退圈后过得还好吗

富书 浏览 9757 07-29

美伊26日谈判在即 是否对伊朗动武:白宫先内讧了

每日经济新闻 浏览 58 02-24

特朗普签署2026财年国防授权法案

财联社 浏览 72 12-20

斯洛特:我认为中卫位置无忧;新队副可能已定但我不会在这说

懂球帝 浏览 3022 07-27

老汉与女子领证被骗70万 女方获刑10年多宁坐牢不退钱

极目新闻 浏览 4386 07-15

美媒感叹:中美已不存在贸易战了 中国巨轮势不可挡

澎湃新闻 浏览 118 11-06

好美啊!58岁的她开挂了

黎贝卡的异想世界 浏览 88 01-03

特朗普称可能将军事行动扩大到墨西哥和哥伦比亚

大象新闻 浏览 57 12-12

司晓迪控诉李云迪!趁自己睡着干龌龊事还拉黑她,喊话男方别惹她

萌神木木 浏览 123 10-31

超适合夏天穿的20条裤子!凉快透气!贼显瘦

Yuki女人故事 浏览 6490 07-06

敲锣15年后"万亿"恒大落幕 停牌时总市值已不到20亿元

每日经济新闻 浏览 9922 08-13

今年夏天“波点”爆火!这样穿复古又时髦

LinkFashion 浏览 3547 06-23

以军空袭也门多个港口 致1死9伤

上观新闻 浏览 1370 05-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3