
新智元报道

【新智元导读】今天,阿里重磅上线HappyOyster 1.0世界模型,一句话直接生成可实时探索、物理交互的开放世界!
「快乐生蚝」,真的来了!
今天,阿里正式放出了HappyOyster 1.0——这是一款可实时构建和交互的开放式世界模型产品。
一句话,即可生成一个完整、可演绎、可探索、可互动的数字世界。
2个月前,阿里曾把「快乐生蚝」放进了公众视野,如今这只生蚝终于长成了1.0。
一句话,一个世界,这次是真的实现了。
世界模型,AI下一个战场
过去两年,文生视频已经相当成熟。
输入一句话,等上几十秒,就能拿到一段成片,它把「文本变成画面」这件事,做得很好。
只不过,成片有它天然的边界:画面生成完,这段视频就定稿了,你能做的是「看」,而不是「参与」。
而世界模型想做的,是另一件事:让你不只是看一段视频,而是走进一个能实时互动、随时改变走向的世界。
这无关谁取代谁,文生视频交付的是「一段结果」,世界模型为你创造的是「一段体验」——
你给一张图、一段话,它生成的那一刻,体验才刚开始。
那它具体是怎么做到的?
它把视频,当成一个需要被持续推演的世界状态,学习世界如何随时间演化的规律——
空间怎么连续、物体怎么守恒、动作之后会引发什么反馈。
它要做的,不再只是「把内容生成出来」,而是「把一个世界持续推演下去」。

放眼全世界,硅谷大厂、AI大佬创业公司,纷纷押注「世界模型」这一赛道。
这其中,不仅有谷歌DeepMind的Genie,也有李飞飞团队倾力打造的Marble。
在这场角逐中,阿里HappyOyster强势入局,路线非常明确:主动式、实时——
你说话的同时,世界就在回应你。
HappyOyster命名的灵感,来源沙翁的名言——The world is your oyster(世界是你的牡蛎 ,撬开它)
如今,阿里把将这句箴言刻印在「世界模型」上,态度很直白:世界,由你来撬开。
快乐生蚝,一手实测
这一次,HappyOyster 1.0核心版本升级,主打两大功能——
世界探索(Adventure):你就是世界里角色的一部分,一句话、一张图,即可开启任意世界的探索。
实时导演(Directing):你就成了那个站在世界之上的人,去导演一整个故事。

百闻不如一见,接下来,我们将开启一场全面的硬核实测。

世界探索:你就是世界里的「主角」
一句话或一张图,你就进入一个可漫游、可战斗、可互动的开放世界。
第一人称、第三人称随你切,还支持1分钟以上的实时位移与镜头控制。
「世界探索」新增了一整套丰富的交互动作:前冲 / 加速、下蹲、攻击、跳跃,还支持更复杂的环境交互——乘坐驾驶载具、使用各类武器战斗。
它真正把「看一个世界」变成了「在一个世界里活动」。
下面这个测试中,我们让HappyOyster 1.0生成了两个壮汉在地下拳馆格斗的场景。
这一场格斗里,攻击、跳跃、闪避这些动作,都是实时操控出来的——出拳、反击、再追打,节奏完全跟着指令走。
关键是,一拳打出去,命中之后对手会触发「踉跄倒退」的受击反应。
HappyOyster凭借着对客观世界的理解能力,根据场景实时演化对应的物理交互,让各种复杂动作实时发生。

