国内的数据要素市场建设正呈现出一种明显的温差。
一方面,顶层设计和规划引领不断。2024年以来主管部门围绕着数据要素市场建设出台了二十多份政策文件,已经从制度体系层面构建起了产业发展的“四梁八柱”。行业普遍认为市场已经呈现出加速趋势。
另一方面,在产业应用实践中围绕着数据流通、流转还有许多切实的问题和困境亟待解决。比如“缺乏加工、缺乏融合、缺乏验证”等难题依然困扰着产业界。
行业资深人士认为,在全社会用数逐步深入,对数据的跨域流转和使用已成共识之际,制约数据要素市场建设的一大卡点在于信任机制缺失。对数据安全和与之相关的风险的担忧正成为数据供给与流通利用的首要顾虑。
针对上述问题,产业界目前已经基于政策指导文件积极展开了积极探索。
在第八届数字中国建设峰会上,蚂蚁密算发布了“密态可信数据空间”产品,基于全栈自研的密态计算技术体系,为数据融合利用加工,提供了高性能、低成本和全链路安全的密态化保障,助力企业、行业及城市等不同场景加速建设可信数据空间。
而通过近十年的持续技术创新,不断降低密态计算成本,蚂蚁密算正为企业、行业及城市等不同场景里的数据跨地域跨行业的可信流转提供一种解法。
01 数据流通亟待安全破局
数据已是驱动经济社会发展的关键生产要素。
以过去两年席卷千行百业的大模型浪潮为例,数据已经成为AI发展的核心驱动力和关键壁垒。
一方面,通用大模型的训练需要海量、多样且高质量的数据。比如,GPT-3.5的参数量为1750亿,GPT4的参数规模则达到了惊人的1.76万亿。
而在参数规模之外,数据的质量也十分影响模型的智能程度。
一位大模型ToB应用商分享过一个案例,通过将区域医疗数据融合到脑卒中预测模型,准确率提升超20%。这实际上验证了跨域数据的临床价值。
行业内资深人士普遍认为,大模型技术在垂域场景里落地,掌握高质量数据已成竞争的主要壁垒。业界观察,一些企业已经从单纯增加模型的参数规模,转向如何获取和利用更高质量的语料库。
不过,硬币的另一面是,拥有稀缺的高质量数据的企业和各类主体,出于安全等各种顾虑,很难放心让数据跨域去流通、流转。
这与数据这一生产资料的特性有关。由于具有高流动性、易复制性等特点,数据源方的利益就很难得到有效保障。
IDC中国副总裁钟振山此前就表示,鉴于大模型对数据的依赖性,企业在采用这项技术时,普遍将数据视为核心资产。对于核心资产,企业需要建立一套有效的保护机制,以确保能够充分发挥大模型的最大价值。
而上述大模型领域里数据应用及流通的现状,只是数据作为生产要素在各个领域和场景里应用需求旺盛但安全流通不足的一个缩影。
当下,全社会对数据要素流通的重要性和必要性已有共识。根据一项国际研究机构的预测,数据流动量每增加10%,将带动GDP增长0.2%,数据流动对各行业利润增长的平均促进率为10%左右。
蚂蚁密算董事长韦韬在2025年数字中国建设峰会的分享中也指出,数据要素价值的释放,核心在于数据要素参与方之间“联合加工”的效能。
不过,即使全社会对数据跨主体融合形成共识,数据流通和数据要素市场建设依然存在拦路虎。
韦韬认为,当下数据价值释放正面临“缺乏加工、缺乏融合、缺乏验证”三大行业难题。
比如数据融合时,数据生产方可能会担心自己生产经营的秘密被泄露,一些数据持有方则担心数据流通过程中的连带责任。这些担忧,使得数据生产方和数据持有方只愿意在域内加工数据,无法将多方的数据融合加工,自然数据也就无法用于千行百业,发挥倍乘效应。
本质上,它是数据产业发展逐步进入深水区,数据流通正从“内循环”走向“外循环”后的产物。
原来数据持有方在自己的运维安全域内对自己的数据使用和安全拥有全责,而进入“外循环”时代,传统基于主体信任的数据安全体系正被彻底颠覆。安全风险正成为数据供给与流通利用的首要顾虑。
IDC日前就指出,当前数据市场供需不旺,主要原因在对数据流通的不信任。
由此,能否构建一个信任机制,保障数据安全,成了当下数据供给与流通利用的关键突破口。
实际上,针对当下数据要素流通中的难题,围绕着数据流通中的安全信任机制建设,国家已出台专门的政策和文件来推进数据安全高效共享共用。
去年11月,国家数据局发布《可信数据空间发展行动计划(2024—2028年)》,这也是国家层面首次针对可信数据空间这一新型数据基础设施进行前瞻性系统布局。其中提出,到2028年,要建成100个以上可信数据空间,形成一批数据空间解决方案和最佳实践。
行业资深人士认为,相关政策方案出台,实际上将形成示范效应,将推动数据空间的发展,这也意味着可信数据空间正迎来建设热潮。
02 密态可信数据空间,破解数据流通难题
顶层设计之下,可信数据空间这一新兴领域正迎来发展机遇,行业内企业纷纷推出产品,加速推进可信数据空间建设。
业界观察,目前,产业链条上涌现出了同态加密、密态计算等多种不同路线,各家企业也基于自身的积累和过往能力沉淀,正从不同的侧重点来构建相关产品。
比如在数字中国展台,一家数据服务商告诉数智前线,他们也有可信数据空间产品,由于比较清楚下游的客户需要什么类型的数据服务以及上游有哪些数据类型,因此他们的能力强项在基于可信环境,帮助供需方找到场景完成匹配。
IDC日前在一份报告里提到,数据空间技术层面的创新在于信任机制的建立。数据空间是安全的数据供应链,在数据提供者和数据使用者之间建立和维持信任关系。
蚂蚁密算日前在数字中国建设峰会上推出的“密态可信数据空间”产品,也以构建跨主体、跨行业、跨区域的技术信任体系为重点目标。
不同于欧洲此前提出的数据空间建设时仰赖产业链相关运营主体和参与方自律,蚂蚁密算认为需要基于可信管控技术,来确保全流程安全可信,从而实现从“主体信任”走向“技术信任”。
具体而言,密态可信数据空间依托蚂蚁在密态计算领域近十年的积累,基于芯片级安全隔离环境、星绽可信系统软件栈、隐语隐私计算框架等核心自研技术,在业内首次完整实现了多主体之间的跨域全链路管控,能够方便多方开展联合加工与价值验证,破解数据流通与应用困境。
具体来说,基于全流程数据信任管控,数据生产方或持有方可以放心引入大量的专业加工方,对数据进行治理和加工,而不用担心他们会窃取数据;参与方能放心将数据进行安全融合,而不用担心其他参与方会窃取或滥用数据;在价值验证环节,多个参与方可以放心的对融合在一起的多方数据进行验证,而不用担心泄露。
任何安全类技术产品的成功应用与落地,都需要充分把握性能、成本、功能与安全性的平衡。
密算可信数据空间产品,也充分考量了安全保障需求、落地成本,在确保性能的基础上,尽量降低产品的应用门槛。
首先,在成本上,蚂蚁密算团队通过可信芯片、机密计算等一整套自研技术,不断降低技术的直接应用成本。
相比传统隐私计算技术动辄要明文计算的百倍以上投入,目前蚂蚁密算技术能把成本大幅度降到明文分布式计算的两倍以内。这能让更多用户有条件用上密态数据空间产品。
他们还设定了一个基准,要让基于密算可信数据空间去做数据流转的整体成本,控制在流通成本的5%。
“这是一个相对合理的指标,保障了行业在安全上投入的可持续性,同时对客户来说又具备性价比,行业要做到同等安全程度,投入基本要到流通成本的10%”,蚂蚁密算CEO王磊介绍。
同时,在性能上,目前密态可信数据空间产品支持集中式和分布式两种计算模式,能实现PB级数据的分钟级计算,足以承载行业里面绝大部分的数据流转融合的需求。
为了方便产业用户用起来,蚂蚁密算还提供了一整套技术栈和工具体系,方便用户去做密态研发,尽量在使用密态数据时,让用户能像用明文数据类似的方式,无感使用这些数据。
另外,他们也十分重视降低用户使用门槛,目前,隐语隐私保护计算框架、星绽可信系统栈等核心组件已全面开源,企业可快速搭建应用。同时,密态算力支持跨云、集群及单机等多种部署方式,大幅降低企业应用门槛。
03 新兴赛道,从标杆到规模化应用的探索
目前,蚂蚁密算的技术和产品已经在车险、普惠金融等场景开始了先行落地探索。
以普惠金融场景为例,我国存在着大量小农户,由于种植面积小,地域分散,缺乏抵押物、数字化程度低,此前他们很难得到普惠金融服务。
农业农村部大数据发展中心基于蚂蚁密算计算技术,将网商银行的遥感作物识别结果、授权用户信息,与农村农业部大数据发展中心的乡村动态数据进行密态数据的联合建模。建模结果向银行保险业开放后便利了小农户的风险刻画。目前,有超760万农户获得了普惠金融服务,累计授信额度超1990亿元。
在这些场景里,一个明显的特点是,数据价值一旦得到验证,各类相关方就有很强的参与意愿,数据也在加速流通流转。而整个环节的核心恰恰在于——在融合、验证过程里,基于蚂蚁的密算技术,确保了不产生数据泄漏和滥用。
围绕着可信数据空间建设,韦韬认为涉及到技术、基础设施、合规和流程等多个关键点需要打通。“目前技术上的可行性并不存在问题,在一些标杆场景里已经得到了价值验证。”韦韬告诉数智前线。
而先行的落地场景也体现了这一领域对基础设施建设和投入的倚重。在金融、医疗等高敏感高价值场景里,企业有比较急迫的需求,才有能力与意愿去构建基础设施。
标杆场景和先行行业推动后,相关的行业标准和机制也需要跟上,之后其他行业使用的边际成本会大幅度下降。到这一步,广大中小企业和全社会才会成规模地用上新技术。
业界观察到,目前国内的数据要素产业正在加速发展,背后的推动力既有来自顶层设计的强化、政策体系的完善,也有来自市场需求的高涨以及新技术的加速融合应用的推动。
比如从城市、行业和企业三类不同类型主体市场占比不均衡的发展态势上,尤其城市类数据空间占大头,能看到在顶层设计驱动和政策强化下,国央企市场先行的特征。
IDC日前在一份报告中预测,2025年中国可信数据空间市场规模为30.4亿元人民币,其中城市数据空间占比超过56%。
产业界人士告诉数智前线,之所以呈现出城市数据空间先行的趋势,可能与可统计口径有关。目前可信数据空间作为国家数据局大力推动发展的领域,国央企或者是政府最先动起来,同时基于公开的招投标项目,这类主体也最容易被统计到。
而随着数据要素的深化应用,IDC认为,行业数据空间和企业数据空间的增长预期将远超城市市场空间。
韦韬也判断,在这个刚刚起步的市场,城市数据空间和行业数据空间解决公共数据供给的问题,后续企业数据空间的需求量可能是前者十倍以上规模,有着巨大的发展潜力。
上周,韦韬与几十家国央企CIO交流后已经看到了大型企业集团里不同主体之间的数据流转正对可信数据空间的安全和服务有着强烈的诉求。蚂蚁这样的大型企业在数据的使用、治理上走在前列,围绕着可信数据空间上的实践正吸引了许多大型企业集团的关注。
蚂蚁密算团队认为,当下蚂蚁有成熟产品和方案来解决问题,未来这些技术和产品也可能为这大型央国企的痛点提供解决思路。
当下,行业还在继续发展,市场上围绕着数据流通的需求和潜在的场景十分丰富,如何在一个个场景里跑通从技术到基础设施、合规标准以及数据审批流程等全链路,是当下整个行业需要去攻克的课题。而一些卡点凸显出来,正是行业发展逐步进入深水区的表现。
“我们相信,通过持续攻克核心技术、推动产业创新应用落地、建设数据标准、优化审批流程、释放政策红利等多重因素的共同作用,有望在数据价值释放这一全球性挑战上,创造出新的中国实践。”韦韬表示。