近日,天津移动基于华为 AI WAN 高算效广域方案在天津东丽融媒体中心与天津空港智算中心之间,成功完成基于Qwen大模型的端云协同推理拉远试点——将大模型“一分为二”:敏感计算留在本地,仅将不可还原的中间特征传输至云端,通过无损智算专线实现毫秒级协同。这意味着,行业用户能在核心数据“不出园区”的前提下,像使用水电一样按需调用云端算力,为数据敏感行业提供了兼顾安全与效率的AI落地新范式。

天津移动端云协同推理试点
当前,政务、医疗、融媒体等领域的AI推理需求呈爆发式增长。然而,企业私有数据高度敏感,要求“数据不出园区”。园区普遍受限于散热、供电、空间等条件无法规模部署算力,也无法有效接入云端AI能力。
天津移动与华为探索出端云协同解决方案,从根源上化解了这一次矛盾。在东丽融媒体中心部署华为星河算网一体机(端侧),承接本地内容初审、实时风控与私有素材属地化运算,实现核心数据不出域;在空港智算中心配置算力集群(云侧),负责不可还原的中间层特征的大规模并行推理、AI内容深加工等复杂任务,兼顾属地合规管控与全媒体生产效率,同时支持弹性租赁运营商算力资源。
本次试点在真实网络环境下重点验证了三大核心能力:
● 长距离无损协同,云端算力“像在本地”。华为首创的基于用户优先级的流量控制技术,为每个租户配备了专属的“智算快车道”。实测长距传输效率高达97%,为运营商 “算力服务延伸至任意企业园区”提供了网络基础。
● 模型切分分层推理,核心数据不出园。大模型关键隐私运算留存在企业端侧,只有无法反向还原的中间层特征上传云端。即便传输链路中数据被恶意截获,攻击者也无法还原原始数据,从架构层面彻底化解“数据安全”与“算力租用”的矛盾。
● 按需弹性扩缩容,算力即取即用。以典型融媒体场景为例,端侧1台+云侧2台服务器协同工作,4K视频实时AI剪辑与字幕生成——本地处理敏感素材(如未审片段),云端完成渲染计算,业务高峰自动调用云端资源,业务结束后,资源即时释放。
此次试点的意义不仅在于技术突破,更在于为运营商探索了一种全新的算力服务模式——从单纯的“卖算力”升级为提供“安全算力服务”。
天津移动相关负责人表示,“我们为数据敏感行业提供了一个新选择:既不必自建大规模算力基础设施,也无需牺牲数据安全,即可享受云端大模型的强大推理能力。”