钟新龙:大模型也有“不可能三角”,目前还需解决几个难题
7 小时前 / 阅读约17分钟
来源:凤凰网
我国相较于美国的优势在于拥有完整的产业链体系和更多的工业场景。

编者按:

随着ChatGPT的爆火以及具身智能的大规模出现,利用AI大模型的通用人工智能带领人类进入第四次工业革命的设想,在欧美世界尤其是金融圈成为最热门的话题。受此影响,国内不少相关人士也在强调美国领导的西方体系会利用其“算法+数据+算力”的三重优势对我国形成技术代差,从而导致我国在潜在的“第四次工业革命”中落于人后。

但是随着人工智能大模型的演进和实践,更多人意识到,这套叙事存在逻辑瑕疵。而在这场再认识的过程中,更多人对于人工智能的潜力和局限有了更明晰的认知。于是就在今年4月,工业和信息化部直属单位中国电子信息产业发展研究院(赛迪研究院)正式发布了《人工智能赋能新型工业化:范式变革与发展路径》报告。

在人民大学和赛迪集团联合举办的“人工智能赋能制造业:国际治理经验与产业安全”会议上,赛迪研究院未来产业研究中心人工智能研究室主任钟新龙先生就人工智能在赋能新型工业化的过程中所遇到的阻碍和未来发展前景进行了系统阐述。观察者网获人民大学国际关系学院副院长、区域国别研究院翟东升院长授权,整理、刊载钟新龙先生演讲全文。

【演讲/钟新龙,整理/观察者网 唐晓甫】

很多人说“人工智能的历史既长又短”。

其“长”,在于人工智能概念可以追溯至1950年,当时计算机奠基人图灵提出了著名的“图灵测试”。他认为,若第三方无法区分计算系统与人类的回答来源,则可认为该系统具有智能。由此,人工智能的概念自1950年起便有了理论基础。

其“短”,则在于大众层面对人工智能的广泛接触,应当以2022年11月发布的ChatGPT为分水岭,截至今日仅有两年多的发展历程。

图灵&ChatGPT

我们认为,大模型时代的到来标志着人工智能进入了一个新的发展阶段。在我们看来,通用人工智能是人工智能进入高阶阶段的标志。

在这个阶段,传统的机器学习、深度学习等技术与之并非彼此排斥,实际上可以协同为制造业赋能。

迄今为止,我们已经在智能制造领域建设了一批智能工厂,其中包括不少刚刚评定为卓越级智能工厂在内的智能工厂。通过“人工智能赋能新型工业化”工作的推进及研究过程中案例征集情况来看,我们发现,我国人工智能在工业领域的应用正由单点突破向系统集成发展。此前,人工智能在质检、判别及工业流程等单一环节有较多应用,整体较为集中。而我们当前的目标是实现其与更多工业系统的深度融合。

总体而言,人工智能可在工业领域提升生产力和效率、创造价值、优化资源配置。基于上述三方面的赋能,人工智能能够加速培育新质生产力,成为推动经济发展的重要引擎。

以此为基准,我们期望人工智能能够赋能千行百业,实现“人工智能+”与“+人工智能”的双重迭代和赋能。诚然,我们对通用人工智能赋能工业化寄予厚望;但现实情况是,当前工业领域仍大量依赖前些年开发的小模型。当今中国,大小模型并存的局面已成为工业实践中的常态。

在工业领域,当前小模型主要负责结构化数据处理与精确预测;而以GPT、DeepSeek为代表的生成式大模型则擅长处理复杂的非结构化新数据。就制造业流程而言,通常可分为离散型制造业与流程型制造业两大类。

目前看来,人工智能在智能制造基础扎实的重点领域表现最佳且成熟度较高,例如汽车制造业。现在我们看到人形机器人优先选择进入汽车厂的原因在于,汽车行业作为离散型制造业,其属于智能制造领域,是数据采集环境和处理能力最好的那一档。这也是我们常说,人工智能优先赋能合适领域的逻辑。

若将工业制造流程划分为研发设计、生产制造、经营管理和产品服务四个环节,在综合数百个典型案例后,我们发现大模型和小模型在不同领域的应用渗透率呈现“正U型”与“倒U型”叠加趋势。总体而言,小模型更多用于单一场景的判别,呈现“倒U型”分布,这与其适用于单一场景的特性相吻合。

生成式AI(大模型)和判别式AI(小模型)在工业主要领域分布情况

相较而言,以生成式人工智能为主的大模型在工业赋能领域仍处于初级阶段。当前,大模型主流应用集中于智能客服、业务管理或边缘性建议中。而大多数人所期望的,是让大模型直接介入生产制造流程,乃至实现自主决策的高阶自动化应用方面,大模型尚在迭代探索之中。

总体来看,人工智能在制造业领域主要有五大赋能目标:一是效率提升,如排产调度优化等;二是质检改进,通过视觉神经网络等技术提高检测效率;三是成本降低,这是工业赋能的核心命题;四是创新驱动,希望生成式大模型在产品设计、工艺优化等方面提供新思路;五是决策优化,旨在为企业管理层提供更科学、及时的决策支持。

我们现在常说,“AI for Science”。未来,我们期望其进一步发展为“AI for Industry”,并最终实现“AI for Society”的社会价值。目前,人工智能在工业领域的赋能仍以人机协同、共同进步的创新研究为主。

从实地调研来看,AI大模型在工业领域的赋能尚未达到预期的成熟应用阶段,而仍处于初级阶段。这背后有多重原因,其中首要问题是应用场景推广与落地难题。

首先,工业场景细分程度极高。我们固然期盼通用解决方案,包括大家一直期待的所谓智能体打通大模型落地的“最后一公里”,但在实际工业场景中,经常出现一条指令往往会影响数亿元的决策,目前的智能体尚无法对相关风险进行充分控制,因而难以实现落地。

其次,工业领域涵盖众多细分行业与应用场景,每个场景均具有独特特点与需求,难以研发出通用的人工智能解决方案。过去二三十年工业化进程中积累的数据分散于不同系统,人工智能应用呈碎片化特征,往往只能适用于特定场景,难以在更广泛范围中推广,这增加了技术落地的难度。

第三,由于工业生产过程中的数据分散于不同系统中,且在数据格式与标准上缺乏统一性,获取与整合这些数据需要耗费大量时间和资源。人工智能解决方案通常需要高度定制化,这进一步增加了开发成本与实施难度。碎片化的系统与数据架构必然导致智能体定制门槛和响应时间呈指数级增长,可能与企业快速响应市场需求的目标相冲突。

最后,从企业开发角度出发,大家普遍期望拥有一个可以通行千行百业、快速复制的大模型,以降低边际成本。然而,由于各行业之间存在巨大差异,不同场景下开发的人工智能模型难以直接应用于其他场景,这降低了导致模型复用率下降,增加了总体开发成本。

这使得定制化人工智能解决方案的成本难以摊薄,投入产出比低,难以形成可持续的商业闭环。高成本、低回报的局面严重阻碍了企业采用人工智能技术的积极性。

人工智能的三大核心是算力、算法、数据,但在实际落地过程中,数据治理也是人工智能落地的障碍之一。这些挑战既涉及数据的获取与整合,也涵盖了数据的处理与安全应用,以及数据权属与价值评估的划定。由于这些问题的存在,人工智能技术在工业领域的应用效果大打折扣,需要从多方面加以突破。

具体而言,分为三点:

第一,在工业生产环节,要想获得和整合关键数据并非易事。生产过程中产生的核心数据往往蕴含商业或技术机密,企业通常不愿共享这些数据。与此同时,传统工业设备并不具备完善的数据采集能力,增加了数据获取的难度,同时整合也面临着巨大挑战。工业企业通常使用多个独立信息系统,系统间的数据格式和标准上的显著差异,导致数据的统一整合面临重重困难。

即便数据能够被采集,如何清洗噪声、剔除异常值或补全缺失数据,也是一项巨大工程——尤其是在此类数据与现在用于大模型预训练的标准数据存在显著差异的情况下,很容易影响模型的训练效果与预测准确性。而要在充分利用数据价值的同时确保其安全,存在复杂的技术和管理挑战,需要企业在数据加密、访问控制和隐私保护等方面投入大量技术与管理资源。

第二,在数据权属界定和价值评估方面,工业数据的复杂性使得其难以归入传统法律关系客体,导致产权界定模糊。工业数据涉及利益主体多元,其诉求多样且存在冲突,使得达成共识变得困难。现有工业数据产权界定方法存在不足,缺乏灵活性和适应性,难以应对数据的动态变化。而且传统法律体系以及现行信息管理的规章制度,对此类数据的规范也存在一定的问题。

第三,现在大模型算法本身也和工业逻辑存在一定冲突,工业追求决策过程可解释性,要确保可控性和可追溯性达到最高水平标准,不能在准确性方面出现差错。

然而,目前无论是ChatGPT,还是DeepSeek这些生成式大模型,上述三点都难以完全满足。这是今天人工智能赋能新型工业化领域仍处于起步阶段的原因之一。

实际上,人工智能自身就存在“算法黑箱”问题,因此工业生产一线的负责人和企业在推进大模型应用方面受到诸多限制;同时,由于过程机理的不可解释性和先天的“算法黑箱”特性,往往正好与这一需求背道而驰。实际上,当一线负责人需要对生产异常进行定位或溯源时,大模型的不可解释性就成为了最大障碍。

同时,工业生产对精度的要求极高,典型意义上往往需要达到“四个九”(99.99%)乃至“五个九”(99.999%)的可靠性水平;而现阶段的生成式大模型却更常表现为“十次回答中有九次正确、一次出错”,显然无法满足工业级工具的标准。这也在很大程度上解释了为什么人工智能赋能新型工业化尚处于起步阶段。

大模型由于幻觉等问题,尚不能满足不少工业需求

所以我们在推动产业-技术双向对接的过程中,更多是从工业企业与人工智能企业双向对接的角度入手,但也由此又暴露出以下三大挑战:

首先是因专业背景差异导致沟通鸿沟。一方面,人工智能技术人员往往缺乏工业领域的实践经验,难以准确理解和把握工业专家要求,常常导致前者对生产场景的特殊需求缺乏深刻理解;另一方面,工业领域的专业人员又对人工智能技术的理解和应用能力有限,难以有效配合技术支持方实现技术落地。

其次是因项目定制形式制约泛化应用开发,目前行业内对大模型的落地开发普遍采取项目制、定制化合作方式。这种方式虽然能够针对单个需求进行深度适配,却严重制约了大模型在工业领域的泛化应用。

一方面,深度定制使得技术方无法利用已有项目经验和基础进行快速复制,延长了开发周期,影响了大模型产品的规模效益。另一方面,由于大模型本身的快速迭代导致缺乏标准化解决方案,每个项目都要投入大量资源进行重置基础工作和并进行适配,增加了项目成本,降低了企业的投资回报率。例如在DeepSeek之前,我们主要考虑的是通用大模型,在DeepSeek引入思维链(Chain of Thought)机制,行业主流转向“推理大模型”。随着大模型演进,基础技术迭代之快也让项目制交付的质量能否保持成为双方都需要担心的问题。

第三方面是因商业模式不明影响持续合作,这主要包含两点,一是AI技术在工业领域的价值变现面临着巨大的不确定性。即便是OpenAI或Google这样的行业龙头,也尚未实现稳定盈利。据奥尔特曼披露,OpenAI每年亏损约50亿至70亿美元。而AI项目需有持续性的投入,以不断优化和升级模型,这导致投资回报周期被大大拉长,从而削弱了企业的投资积极性。这是人工智能企业发展中一个悬而未决的问题。

大模型迭代速度很快

二是由于缺乏成熟的商业模式可参考的应用案例和标准化的收益评估体系,供需双方对价值分配的认知也难以统一。

在对大模型落地至关重要的性能评估方面,学术界常用的AMIE、GPQA等顶刊基准测试,与工业应用场景的需求相去甚远,无法衡量模型在真实生产环境中的技术水平。要想真正推动大模型在工业现场的规模化应用,亟需依据国内外的工业基础条件,建立一套契合实际业务场景的评估体系,才能更高效地推进大模型在工业领域的落地。

基于上述分析,我们认为,赋能新型工业化应当以循序渐进的思路推进:在初级阶段,优先在封闭且对精度要求极高的场景中采用传统小模型,同时在对精度要求相对宽松的开放场景(如客服问答、流程调度等)中试用大模型。通过先易后难、先用为主的策略,以场景驱动加速技术迭代的模式,让人工智能在工业领域不断释放更高的赋能价值和潜力。

现在通用人工智能仍处于“数字世界”中,而在进阶阶段,工业生产需要通用人工智能跨越数字与物理的边界,真正融入“物理世界”。现在不少人推动人形机器人为代表的具身智能进入工厂干活,就是这种探索的缩影。

从这个角度,以及之前提到的大模型和小模型在产业链上的“正U型”“倒U型”分布特性,我们希望在进阶阶段可以构建一个大小模型协同的赋能体系:既不盲目追求单一大模型,也不小模型,而是持续探索人工智能的能力边界,稳步推进应用落地。

最终,在高阶阶段,我们的目标是实现高度智能的“通用智能制造”。

现在大模型在经济性、泛化性与专业性之间存在“不可能三角”。我们希望通过大模型和小模型串联,基于类似Mixture of Experts(MOE)的架构,将大模型与小模型有机串联,覆盖端到端、全流程、全要素、全场景的需求,从而为工业整体提供深度赋能。

大模型“不可能三角”

基于上述设想,我们认为工业模型的培养与应用亦需循序渐进、分阶段推进。初阶段应着力优化提示工程与引导,通过精心设计的提示词与示例,为模型提供明确的指导,以提升其对任务需求的理解和场景适应能力,实现“先行实施”的目标。

进阶阶段需要赋予工业模型检索增强能力,使其在生成过程中能够根据需要查阅外部知识库或调用“知识记忆”,在扩展模型知识储备的同时,进一步拓展应用场景。

高阶阶段则需通过大规模采集行业内的多源异构数据,从头预训练原生工业大模型。在这一阶段,应采用模型并行化等前沿技术,充分融入领域知识与实践经验,使大模型能够与其所在领域实现“天生适配”,而非简单地将DeepSeek一体机直接搬入工厂,实现所谓的“开箱即用”。这种“开箱即用”只能用,但是用得好不好,我想一线人员是很清楚的。

在其他配套要素方面,同样分为初阶、进阶和高阶阶段。算力方面,初阶阶段政府可利用现有算力资源,集中力量打造区域算力中心,为工业大模型的预训练与工程应用提供基础支撑,并规划建设城市级算力网络,初步实现毫秒级的低时延算力供应。

进阶阶段,随着工业大模型逐步成熟、各行业场景应用落地,算力需求将快速攀升。须加快建设高性能算力集群,提供算力“加油站”,以满足工业大模型、尤其是推理环节对海量算力的迫切需求;同时加速部署市级算力网络,进一步缩短时延,确保算力高效调度。

高阶阶段,随着人形机器人、自动驾驶等新兴场景兴起,相关模型训练与推理对算力需求将呈现爆发式增长。此阶段要着眼长远,扩容升级算力集群,构建核心算力枢纽,实现毫秒级跨域调度,为“十五五、十六五”乃至“十七五”期间迈向AGI提供协同配套。

在数据层面,以此前特斯拉FSD在中国落地效果不佳为例,其主要原因在于缺乏中国本土的一手视频数据、未针对中国场景进行优化。因此,我们期望未来在汇集各行业结构化与非结构化数据的基础上,对这些多元异构数据及真实迭代数据进行反复推理与训练,形成闭环的数据飞轮,攻克能力上的“最后一公里”难题。

因此,我们必须尊重客观实际,让大模型优先在数据基础较好、数字化水平较高的行业开展试点示范。这些行业在信息化建设方面已有较深积累,能够提供相对丰富且高质量的数据资源,为人工智能模型的训练与优化提供充分“粮食”,并通过先行先试发挥示范引领作用,形成可复制、可推广的经验模式。

同时,需要依托龙头及骨干企业的资源与研发优势,优先解决重大应用难题。一方面,龙头企业应发挥引领示范作用,充分利用技术、资金、人才等雄厚资源,聚焦行业共性需求,加快推动人工智能规模化应用;另一方面,也要以大模型为牵引,借助后发优势,引领国产工业软件实现弯道超车。

中小微企业因自身难以研发大模型、承担原生模型训练与调优工作,应利用体制机制的灵活性,聚焦场景迭代。通过鼓励中小微企业参与大模型的数据迭代,可以为大模型发展提供多元场景支持,构建大中小企业协同的智能体系。

我们常说,在工业应用领域,我国相较于美国的优势在于拥有完整的产业链体系和更多的工业场景。但是更多的工业场景并不代表我们的需求会比美国方面更大,这些场景真正的价值在于由此产生的持续迭代数据。通过模型与数据飞轮的迭代模式,我们更有可能获得强有力的创新成果。这正是凭借全产业链体系和丰富工业场景,在未来长期竞争中取得优势的关键。

原标题:钟新龙:大模型也有“不可能三角”,中国想保持优势还需解决几个难题