DeepMind发布了Genie 2模型,该模型能根据文本和图像生成交互式3D场景,实时模拟物体交互、动画、光照、物理反射及NPC行为,画质可达AAA级别。此外,Genie 2能记住场景中不在视野内的部分,并在其再次出现时准确渲染。谷歌持续加大对世界模型研究的投入,近期DeepMind聘请了OpenAI前视频生成项目负责人Tim Brooks,并从Meta挖角Tim Rocktäschel。