中兴通讯CDO崔丽:全栈TCO最优成为AI基础设施竞争的关键
来源:C114 11 小时前

5月30日,中兴通讯首席发展官崔丽受邀出席在澳门举行的BEYOND Expo系列活动。在数字AI峰会(Digital AI Summit)的开场“基础设施赋能AI进化”的炉边对话中,她就AI产业演进洞察、AI基础设施架构设计、软硬协同能力体系、AI时代女性独特价值与个人成长等多个议题,与主持人艾诚做了深入分享。

内容提要

·AI与通信产业异同:通信稳进迭代、专业且高度标准化,可靠性要求高;AI则超高速迭代并进入应用驱动阶段;两者均属于复杂系统工程,AI正呈现出与通信产业早期类似的演进逻辑,全栈全域技术积累与系统工程能力成为核心可复用财富。

·AI基础设施设计原则:开放解耦、可扩展、灵活适配、全栈最优。AI竞争正从单点突破走向系统协同,算、网、存、能、软的超大复杂、系统级的极致协同成为基础设施能效比的核心。

·AI能力体系: AI竞争的下半场,“软硬兼施”和“领域沉淀”才是真正的竞争壁垒。中兴通讯全栈全域的技术工程积累和全球化经验,正在成为其‘隐形护城河’。

·AI时代女性独特价值:女性天然具备的延迟满足、韧性、细腻敏锐、共情包容等优势,将在AI时代发挥更大作用。

·AI时代个人成长建议:保持好奇心与批判性思维,以“一专多能”和“文理双修”拓展认知边界,在技术快速演进的时代,以信念、敬畏、爱与感恩构筑长期成长的精神内核。

对话全文

主持人艾诚:大家好,我是艾诚。在澳门这个多元交融的城市,今天我们要谈一个最热的话题——AI。但有趣的是,我身边的崔总,教育背景恰恰是'热能工程'。崔总,如果用热能工程师的视角,给当下的AI热度测个温,您觉得现在是几度?是可持续的'恒温',还是需要降温的'过热'?

崔丽:感谢艾诚详尽的背调,的确我的本科专业是热能工程,保送研究生无法更换专业,所以我选择了热能系统软件开发,研究生毕业后加入中兴通讯的27年,都在ICT技术领域深耕。用温度的确不太好准确表达AI热度及未来发展。我愿意换个说法,就是像寒武纪一般的生命大爆发,不同于的是寒武纪是碳基生物,而本轮则是硅基智能的爆发。我相信它会跟历次工业革命一样,在经历初期的技术高速迭代之后,会进入一个长达数年或数十年的技术扩散过程,在深刻变革人类社会方方面面的同时,也将带来更多的新业态。

从通信老兵到AI基础设施架构师

主持人艾诚:您在中兴27年,从2G到5G,参与了中国通信业的完整周期。现在从移动通信转型AI基础设施,这两个'基础设施'建设和发展周期最大的不同是什么?哪些经验可以复用?

崔丽通信是稳进迭代,专业且高度标准化,且对可靠性要求较高,也被称之为信息高速公路。通信业数十年一代代的努力,持续向香农极限冲击,希望类似频谱等有限的资源可以被最大化利用;同时,基于互联互通的需求,通信也是高度标准化的产业,大家都是在遵循标准的技术上再有各自的创新,或者将创新融入下一代标准中。再有,受限于用户终端更换频度,运营商的网络往往也会呈现多种代际技术并存,而且需要根据用户发展和业务变化持续进行网络优化。正是这些特征决定了通信基础设施较高的技术门槛,行业里主要玩家趋于寡头。

当下AI则超高速迭代,跨学科且已经进入应用驱动。这波AI大模型技术在泛化和涌现后,进入一个超高速的迭代周期。作为一个广泛赋能的底层技术,这种动态高速演进其实会给基础设施建设带来比较大的挑战。回顾自ChatGPT发布之后AI三年多的发展历程,大概每六个月AI就会有一次关键性突破,产业重心也会进入下一阶段,比如大语言模型、多模态模型、推理能力进阶、开源爆发成本骤降、智能体/具身智能等应用拓展;在此过程中,算法和架构的创新更是层出不穷,重量级创新包括MoE、MLA、量化、蒸馏、注意力机制优化、超长上下文等等。不同算法需要不同硬件才能做到性价比最优,而系统架构和硬件架构则大概2-3年一个周期,所以必须去判断两三年后的AI发展方向;同时,架构的开放解耦和可扩展性会成为中长期竞争力的关键

通信和AI基础设施也有很多类似的地方。首先,无论是CT、IT还是AI,核心都在于数据的处理、数据的交换和数据的存储。其次,通讯与AI都是复杂超大系统的高效协同,通讯涉及多个网元组成庞大的网络,AI需要芯片、服务器、存储、交换和数据中心组成高效绿色的基座。两者不仅需要局部最优,也需要芯片、硬件、软件、资源调度和应用等的全局优化,需要具备全栈的技术积累、工程实践和系统优化能力。国内来看的话,也是从英伟达的硬件集成到DeepSeek软件创新,到光互联,算法和硬件的创新,到场景落地的领域和应用创新等。所以看起来AI的发展跟最初通讯的演进整个发展逻辑相通

AI的发展本质上是一个跨多学科的复杂的工程科学,而且这一波大模型也是源于产业实践而非学术创新,它的创新进程始终离不开大量工程实践经验、参数调优、算子融合和算法优化、生态构建等等,涉及领域广、技术门槛高。对于这种超大规模的复杂系统工程,全栈全域的技术积累和系统工程优化能力是核心可复用的财富

主持人艾诚:从CT到AI,变的的是技术范式,不变的是中兴对'系统工程最优化'的执着。这或许是传统巨头转型中最宝贵的'隐性知识'。

AI基础设施架构设计四大原则

主持人艾诚:崔总提出AI基础设施的四大原则:开放解耦、可扩展、灵活适配、全栈最优。我想做个现场调查:如果您是投资者,这四大原则中,您最看重哪一项?请用掌声投票——1. 开放解耦(避免被绑定);2. 可扩展(小步快跑);3. 灵活适配(场景为王);4. 全栈最优(成本控制)

看来大家最关心的是成本控制。崔总,这是否说明当前AI投资正在从'追求技术领先'转向'追求经济可行'?

崔丽:感觉大家对技术和市场的焦点判断都非常准确。的确当下已经进入应用和技术扩散阶段,大家更加关注全栈TCO最优和经济可行。但这背后的逻辑我也愿意跟大家分享一下,因为这对于后续趋势判断也有帮助。

从大模型性能来看,去年年底,全球顶尖通用大模型的性能差距已显著缩小。Google Gemini系列与OpenAI旗舰模型的性能不相上下,中国如千问、DeepSeek、智谱、Kimi 等则快速逼近,均处于全球第一梯队。差距缩小的核心原因主要在三个方面:首先从技术层面看,大模型核心架构与优化算法已逐步成为行业通用知识;其次,开源生态的爆发式增长打破了闭源模型的垄断格局,进一步加速了创新扩散和共享;此外,算法和工程等方面的持续优化带来模型生产成本的快速下降,大幅降低了入局门槛。从AI技术热点而言,去年年底到今年,已然从Chatbot形式的“能说”迈向“Agentic AI”方式的“会做”,以“感知—规划—执行—反思”自主行动和自我进化,并且在以Agents和具身智能等多种形态逐步从数字世界延伸至物理世界,业界重心也从Prompt Engineering到Context Engineering到Harness Engineering。

基于上述分析可知,AI发展已然进入到技术创新和技术扩散并举,即应用驱动为主的阶段。同时Anthropic预计今年二季度盈利,显然给资本和市场对于商业模式闭环带来更大的信心。因此,科技巨头的市场竞争重心已从单纯比拼模型能力到比拼提供智力服务的竞争力,算力竞争度量体系,也从芯片走向系统、全栈能力和生态,从峰值参数走向端到端能效,即Tokens/w,即TCO最优。算、网、存、能、软的超大复杂、系统级的极致协同成为基础设施能效比的核心。

此外,我想特别强调一下,刚刚艾诚给出的前三个选项,也是实现全栈最优经济可行的不可或缺的关键。首先就是开放解耦,正因为技术依然处于高速迭代中,只有开放解耦才能最大限度吸收和内化业界最新成果和实践;其次是可扩展,以小步快跑代替一步到位,可以更好的降低硬件折旧压力;再有就是灵活适配,根据场景和应用特征能够支持量体裁衣,适合才是最好的,才能提供最优性价比。

软硬协同:中兴通讯的全栈全域能力体系

主持人艾诚:谈到AI基础设施,大家首先想到的是芯片、服务器等'硬实力'。但您在之前的公开场合也特别强调过'软实力'——资源调度、领域知识注入、安全合规。在这些'看不见的战场'上,如何做到软硬协同,并具有自身的独特优势呢?

崔丽:硬实力在于大道至简,也就是“把最难的事情做到最好”的一种匠心和坚持,更多是对确定性领域的持续深耕,要想达到全栈TCO最优,需要单点的极致性能和高效的系统协同并重。在底层核心能力如芯片、架构等方面,中兴通讯的目标是成为国产AI开放生态的主导者和建设者。通过全自研机内/机间高速互联芯片、领域定制处理器芯片、数据及网络加速处理芯片,及适配优化多种主流GPU芯片,秉承开放解耦,兼容优选的理念,构建AI系统级全域芯片能力;零线缆正交互联架构具备架构领先、高密集成、高可靠、简化运维、开放互联等特性,采用组件化设计,灵活支持超节点和超大规模的高能效AI工厂构建。

从产品和解决方案维度,公司推出涵盖超节点、系列化智算服务器、通算服务器、高性能存储及智算一体机等全栈全域智算解决方案,精准契合不同场景下最为经济的建设需求;网络设备支持多种开放标准的高速无损互联,以网强算,持续提升智算中心性能与效率;数据中心则基于模块化、预制化理念,提供液冷整机柜、智算微模块、800V高压直流等多形态产品,弹性适配不同算力规模需求,打造高效、绿色、安全能源基座。

软实力在于唯快不破,就是能够与不确定性共舞的能力。首先,由于当前硬件迭代速度快且厂家众多,混池可能是一种必然形态,如何实现异构资源的高效调度管理需要做特别考虑;其次,从应用拓展和技术扩散角度,如何降低技术门槛,封装复杂性,提高便捷度是至关重要的。一方面,行业或企业场景应用,往往需要在通用基础模型基础上结合领域知识或私域数据做增量训练,并且结合自身情况持续优化推理部署,这就需要有一个简单便捷的训推加速平台;另一方面,未来各种应用开发,可能涉及数据治理、知识图谱生成、一键精调、智能体生成甚至到工具的自进化等,同样需要软件平台或工具包的支持。

中兴通讯始终坚持软硬解耦、模型解耦、训推解耦,聚焦工程能力工具化,提高AI生产效率以及易用性,致力于打造AI操作系统AIOS与智能体中枢。能力平台就包含了上述三个:高效资源调度平台、导航式训推加速平台和应用开发服务平台。除此之外,还有一类特别重要的组织软实力,也就是行业或领域私有数据和知识,以及组织进化过程中的能力沉淀(如组装式研发架构、运营、合规等)。对于企业的智能化转型,AI技术本身是类似的,往往是组织的平台能力决定落地深度,私域数据和知识积累决定价值上限。

主持人艾诚:这揭示了AI竞争的下半场:“软硬兼施”和“领域沉淀”才是真正的竞争壁垒。中兴全栈全域的技术工程积累和全球化经验,正在成为其'隐形护城河'。

女性力量:从热能工程到AI基础设施

主持人艾诚:作为罕见的从热能工程背景成长为科技公司高管的女性,您的职业路径本身就很有启示。特别是在AI这个看似'冰冷'的技术领域,您的'热能工程'背景和女性视角,带来了哪些不同的温度?

崔丽:受教育其实是对学习力和思考力的训练过程,好奇心、批判性思维、持续思考学习和实践,才是个人快速成长的关键。本科虽然学习的是热能工程,但基础物理理论如流体力学材料力学等培养的是物理智慧,研究生的热能工程软件开发磨练了数字智慧和工程场景的结合。职涯则是干中学,进一步提升自己的跨界思维广度和思考深度。

女性普遍拥有的一些特征及优势会在AI时代发挥更大的作用,这包括了:延迟满足、韧性、细腻敏锐、共情包容等等。首先,面向不确定性的未来,需要的不是确定性能力,而是超强的适应力和持续的自我成长,延迟满足和韧性对于这些能力构建至关重要。其次,在快速变化的环境中,感知力是适应变化的源头,女性的细腻、敏感和审美品位都可以培养成一种敏锐的感知力。最后,共情和包容某些程度上体现为爱的能力,是建立信任和链接的关键,这可能是AI永远缺乏也是AI时代不可或缺的。

当然,扬长的同时也要避短。我们有时候容易在细节里打转,或者在决策上过于谨慎。AI也可以成为一种有效补位,通过数据和逻辑帮助校验判断,在感性洞察与理性决策之间形成更好的平衡。

主持人艾诚:崔总的经历告诉我们:AI不仅需要'算力',更需要'平衡力'。在技术狂热中,需要有人记得再强大的AI系统也有'热力学极限'。

给年轻一代的建议

主持人艾诚:最后,崔总,您从软件研发到通信再到AI,完成了三次大转型。对于今天想进入AI基础设施领域的年轻人,您会建议他们重点培养什么能力?

崔丽:我们每个人都需要重新思考如何能够终生学习和成长。AI时代信息过载,刚刚提到的好奇心和批判性思维变得比以往任何时候都重要,批判性思维本质是第一性原理,洞悉技术和商业逻辑的本质。除此之外,在能力培养方面,要注重一专多能、文理双修。真正有竞争力的人,是具备能够跨越单一领域、把握底层逻辑的"多能",以及在专业领域里形成真正判断力的"一专",并以此构建系统工程思维。此外,技术再强,也难以真正理解人类社会的复杂性,具备“文理双修”复合型视野的人,才能真正驾驭技术,让它服务于人。同时,也要注重训练健康的身心,增强感官、运动和综合能力,尤其是在信念、敬畏、谦逊、爱与感恩等层面,这些看似“非技术”的能力,反而会成在AI时代变得越来越重要,成为人与人之间的重要连接与支撑。

我始终相信:科技与人文应成为AI进化的双螺旋基因,技术也始终应当服务于人,拓展人类认知与能力边界,激发潜能,守护人类价值。

主持人艾诚:感谢崔总。今天的对话让我们看到,AI的未来不仅需要技术天才的'突破力',更需要工程师的'系统力'、女性的'平衡力',以及像中兴这样的传统巨头的'定力'。在AI的狂热中,或许最稀缺的不是算力,而是这种'冷静的智慧'。

简体中文 English