阿里云AI将奥运开源:上万帧想象力如何撑起这支冬奥开幕大片?
来源:36kr 2 小时前

01

一支由上万名“导演”操刀的冬奥开幕大片?

米兰—科尔蒂纳冬奥会开幕已进入倒计时。

时隔多年,意大利再次成为冬奥东道主,世界目光重新聚焦这片曾孕育文艺复兴与现代工业的土地。对大多数体育迷来说,熟悉的期待正在回归——赛场、纪录与冠军,仍是冬奥最核心的叙事。

但一个“意外”是,这一届冬奥会所激起的关注,开始从赛场内部,延伸到了更广阔的公共空间。

这源于在开幕前夕发布的一支名为《Your Epic Vibe》的冬奥短片。

与以往高度统一风格、由专业团队完成的官方宣传片不同,这支短片在视觉和叙事上呈现出一种显著的“非统一性”:画面风格各异,主体并不局限于真实运动员,情绪表达也不再围绕单一的胜负与荣耀展开。

随着AI、AIGC进入大众语境,体育赛事的观看、传播与参与方式正在被重新塑造:观众除了接收信息,也开始参与内容的生成与叙述。如何在高度碎片化的媒介环境中持续与更广泛的人群建立连接,成为奥运面临的一项现实课题。

人工智能技术的成熟,为奥运提供了一种新的可能。随着AI、AIGC进入大众语境,创作门槛与表达成本被显著降低,内容生成不再局限于少数专业团队。在基础设施逐渐完善的前提下,奥运开始探索一种新的方法——让更多普通观众,通过表达参与其中。

这也让《Your Epic Vibe》从创作之初便呈现出不同的气质。这支短片的素材,汇聚自全球普通观众基于AI生成的创作成果。支撑这些创作的,是由国际奥委会、阿里云与米兰—科尔蒂纳冬奥组委联合发起的“米兰冬奥会AIGC全球大赛”。

来自不同国家和地区的冬奥爱好者,可以基于阿里云万相AI,通过文字描述生成与花样滑冰、短道速滑、高山滑雪、单板滑雪等项目相关的影像作品。参与者不需要掌握专业拍摄或剪辑技能,也无需理解复杂的运动技术细节,只需用语言表达自己心中的冬奥瞬间,即可完成创作。

大赛的主办方也在尽力将参与方式设计得尽可能低门槛:用户无需下载额外应用,直接通过浏览器即可完成创作;多种语言的自然输入都能够被模型理解并转化为影像;生成的作品还将直接进入官方平台的展示与评选流程,形成从创作到传播的完整闭环。

截至目前,已有来自上百个国家和地区的上万件作品参与其中,这带来了千百种来自不同创作者表达的风格,有人强调速度与力量,有人偏好浪漫与想象,也有人将个人文化符号投射进冰雪场景之中……最终甄选出的优秀作品被汇聚为我们此刻看到的《Your Epic Vibe》。

正因如此,这支短片显露出不同于以往冬奥宣传内容的意义——让观众的“表达”本身成为一种参与方式——也与米兰—科尔蒂纳冬奥会官方口号“IT’SYOURVIBE(意展你风采)”不谋而合。

在AI成为基础能力的背景下,奥运正在尝试重新通过观众的创作、理解、情绪、想象等嵌入自己的叙事,从而找到新的延续方式。

02

AIGC共创,为什么一定是今年?

回看奥运过去一百多年的叙事结构,它高度清晰,也高度集中。

在很长一段时间里,奥运的故事主要由三类主体共同完成:官方机构、主流媒体和转播机构。故事的重心,也始终落在英雄、胜负、国家象征与记录这些高度凝练的主题上。在这一体系中,全球普通观众的参与方式相对单一,即观看比赛,并在既定的语境中投射欢呼、遗憾、骄傲、失落等情绪。这套机制在广播时代和电视时代,合理且高效——当传播渠道稀缺、表达工具有限,中心化叙事几乎是唯一可行的选择。

但近年来,这套结构正面临新的现实环境。

变化首先发生在媒介层面。短视频、社交平台和算法推荐,把注意力切得越来越碎,观众往往是刷着不同平台的片段、花絮和二创内容不断跳转。国际奥委会的数据显示,2022年北京冬奥会期间,其官方社媒账号的互动量达到32亿次,几乎是平昌冬奥会的两倍。

但这组数字背后,其实也藏着一个现实:即便是奥运这样的超级IP,也不再天然占据观众的时间。大家依然关心比赛,但注意力早已分散在各个平台之间。尤其是年轻观众,除了“看”,还会转发、剪辑、玩梗、再创作——情绪的表达变得更多元,却也更难被一条统一的官方叙事完全覆盖。

这也是为什么,过去几届奥运会已经不断尝试各种互动方式:投票、点赞、话题征集、UGC征图……形式在变,但本质没变——观众表达的边界并没有真正被打开。

真正的转折,出现在AIGC技术成熟并进入公共应用阶段之后。

一方面,AI生成把表达门槛压到了极低。影像不再是专业团队的专属,普通人不用学剪辑、不用懂特效,也能做出完整、有画面的作品;另一方面,视频生成让表达可以变成更直接、更具感染力的呈现方式。

米兰冬奥会,正好站在这个时间点上。官方选择把创作本身纳入体系之中:在可控、可筛选的前提下,让大众的表达被规模化接纳。

这也补上了AIGC视频长期缺失的一块拼图。过去,AIGC视频生成无法走向大众的很重要的原因是用户不知道“为什么做”“做给谁”,即缺少稳定的创作动机与明确的反馈场景,因此视频这种高成本表达形式很难像图片一样被持续创作。

冬奥会的介入恰好补上了这一缺口:它本身就是最强的叙事场景,也为作品提供了清晰的去处和被看见的舞台。

因此,本届冬奥会正处于技术爆发与叙事变革的交汇点,这既是对传播格局结构性变革的敏锐回应,也是对观众主体地位的充分尊重,更是对赛事长尾价值延续路径的一次先锋尝试。

03

技术,表达和延续的前提

在所有宏大叙事背后,底层技术的演进才是真正的推手。

长期以来,影像创作的门槛并不低。即便在AI时代,图片与视频的制作流程仍然分裂:生成、修图、剪辑、配乐、输出,每一个环节都可能成为阻碍参与的摩擦点。而一旦生成效果不稳定,用户的表达欲望会迅速被消耗。

与艺术化的风格滤镜不同,冰雪运动是对物理定律的极端模拟,因此在冬奥场景中,技术门槛被进一步抬高。

更苛刻的是,这类视频往往只有短短几秒,没有冗长的剧情去分散注意力,每一帧都在接受人类动态视觉感知的极致审判。阿里云万相视频生成模型的介入,尤其是对最具代表性难题的破解,为这场全民共创提供了技术确定性。

首先是高速运动下的动作稳定性。滑行、起跳、旋转、落地构成的是一个高度耦合的动作链条,人物姿态在极短时间内发生剧烈变化。这要求生成的每一帧都要看起来合理,还要在连续帧中维持稳定的骨骼结构与关节约束。否则,肢体错位、形变拉扯等会带来“身体崩坏”。

针对这一问题,阿里云万相在训练阶段显式强化了时间维度的建模,通过对姿态变化与运动轨迹的联合约束,使模型在生成时优先保证动作逻辑的连续性,从而在5–15秒的短视频窗口内维持完整、可信的运动闭环。

其次是物理真实感,尤其体现在环境如何响应主体动作。冰雪场景中的雪雾飞溅属于典型的复杂粒子系统,大量半透明粒子在不同速度、方向与光照条件下同时运动,对模型的时序建模与光照一致性提出极高要求。许多模型在这一环节容易将细节退化为模糊、粘连的色块。

万相在生成过程中引入了对物理规律的显式约束与仿真能力,使环境粒子、材质反馈与主体动作处于同一生成逻辑之中:雪花的飞散轨迹与滑行速度、角度形成因果关联,运动模糊与光影变化也随镜头运动同步生成,避免了突兀感。

更具挑战性的,是体育转播语境下的镜头语言。高速跟拍、快速变焦与运动模糊,需要在保持主体清晰的同时,对背景进行合理虚化。视频生成模型一旦在主体锐度与虚化边界之间失衡,极易出现轮廓不稳定或类似“果冻效应”的形变感。万相通过在推理阶段引入多重视觉约束,对主体结构与背景层次进行协同控制,使画面在高速运动中依然保持稳定的视觉层级。

如果用户缺乏参与动机与使用场景,再先进的技术也难以形成规模化传播。万相将自然语言理解前移至生成流程的核心位置,先对用户输入进行语义解析,自动抽取运动类型、主体属性、情绪倾向与视觉风格,再转译为内部可执行的生成条件。无论是母语输入、口语化描述,还是带有意象的诗性表达,都无需提示词工程即可直接跑通。

最终,这套由阿里巴巴AI提供的“入口—生成—展示—传播”链路能力,使得视频生成能够作为基础设施嵌入大型公共事件之中。

此次冬奥会,只是一个开始。放眼更广泛的文化场景,这样的变化并不局限于体育赛事。演唱会、传统节日、城市庆典、文化展览——未来,所有具有情绪浓度与公共关注度的活动,都可能通过类似的共创机制,被重新组织表达方式。

04

在AI的参与下,奥运找到了自己的延续路径

就在昨天,国际奥委会主席柯丝蒂·考文垂在国际转播中心举行的活动中宣布,国际奥委会已基于阿里千问打造了奥运史上首个官方大模型。她在现场高度评价了AI技术对本届冬奥会的变革性意义,她表示,得益于千问大模型的技术支撑,2026米兰冬奥会展现了奥林匹克运动的智能化未来,将成为史上“最智能”的一届奥运会。

《Your Epic Vibe》正是智能奥运的一个缩影。在AI的帮助下,奥运迷们也可以通过AI参与奥林匹克宏大的叙事,普通人也有机会让自己的作品成为奥运文化遗产的一部分。

在过去一百多年的时间里,奥林匹克博物馆所收藏的,主要是与赛事本身高度相关的物件:火炬、奖牌、手稿、影像与纪录。它们记录的是竞技的巅峰时刻,是被选中的瞬间,是少数人站在历史中央的证明。奥运的历史,长期以来由这些被看见的“胜利”构成。

而这一次,是来自全球不同角落、不同文化背景的普通人,对奥运的理解、情绪与想象,也能进入博物馆,它们未必完美统一,却真实地呈现了奥运在当下世界中的多重意义。

今夜,圣火将点亮和平门。而这些与圣火一样闪耀的作品,也在和平门旁的博物馆内,正式展出。

“每一届奥运会都会留下独特的遗产。而米兰冬奥会的遗产将是智能化,具体来说,是人工智能驱动的智能化。”考文垂最后总结道,“这份AI能力,正是米兰冬奥会留给世界的‘永恒礼物’,它将重塑奥林匹克运动会的未来。”

简体中文 English