2025鲲鹏昇腾开发者大会下周开幕,超节点架构与AI Agent成焦点
1 天前 / 阅读约4分钟
来源:凤凰网
当前鲲鹏昇腾开发者已超665万,合作伙伴超8500家。

凤凰网科技讯(作者/于雷)5月16日,鲲鹏昇腾开发者大会2025(KADC2025)将于5月23-24日在北京举行。大会开幕前夕,活动媒体预沟通会举行,官方透露了大会将推出的一系列面向开发者的技术创新与支持计划。

AI应用正处于爆发临界点,从辅助系统走向核心业务,从局部走向全局。据透露,今年3月国内日消耗Token已达到10万亿级别,较去年同期的千亿级别实现指数级增长。这标志着行业已从关注“是否有算力”转向“如何更高效利用算力”的新阶段。

在这一背景下,计算基础设施的竞争格局发生深刻变化。市场竞争重点不再局限于硬件算力,软件层面的发力成为决定性因素。特别是在面对CUDA等既有生态的挑战时,开放计算产业生态建设与开发者支持显得尤为重要。

本次会议揭示了AI技术正在经历三重变革:从聚焦模型层算法优化转向底层资源机制与系统工程优化;从单卡部署走向分布式集群部署;从单一模型能力走向多模型协同。其中,大规模专家混合模型(MoE)被视为当前技术发展主要方向之一。

为应对这些变革,鲲鹏和昇腾计算产业推出了一系列创新技术与方案。昇腾推出了超节点架构,能将384张卡连接在一起如同一台服务器运转,特别适合MoE架构中专家间的高效通信。鲲鹏则聚焦于RAG一体机解决方案,通过数据分权分域、物理隔离和虚拟化能力,为大模型应用提供差异化安全保障。

“DeepSeek的出现改变了整个行业部署和应用大模型的商业模式”,会议提到这种便利部署方式催生了线下一体机部署模式,加速了AI技术平权进程。在此基础上,行业将迎来三波部署机会:尝鲜部署阶段、大规模专家并行阶段和强化学习后训练阶段。

与此同时,AI Agent正从被动响应走向主动规划和执行,从单一Agent走向多Agent协同,有望成为新的交互入口。鲲鹏正构筑对XPU算力的弹性调度和QoS保障能力,通过AI Agent内核实现资源并发调度。

在推动开发者创新方面,本次大会形式进行了显著创新,将沟通时间拉长至一个月。会前将于近日启动为期4天、12场线上直播的“鲲鹏昇腾创享周”,聚焦技术细节、原理和代码演示,解决开发者实际问题。会后还将持续进行线上技术公开课,形成前、中、后三阶段支持体系。

创享周精选议题包括鲲鹏AI Agent、鲲鹏+XPU推理、一码多芯开发工具链以及昇腾超级节点架构等技术热点,均聚焦实际开发需求。据介绍,当前鲲鹏昇腾开发者已超665万,合作伙伴超8500家,联合推出的行业解决方案认证超2万个。

在技术开放与生态建设方面,会议强调了CANN能力的深度全面开放,支持用户编写融合算子;同时PyTorch、vLLM等主流框架已支持昇腾。此外,MindSDK开源、MindSpore加速库和全栈工具链MindStudio的开放也将为开发者提供更多支持。

在医疗、金融、政务等垂直领域,AI技术正加速渗透。例如,在金融领域,鲲鹏应用已深入核心交易系统,而昇腾则应用于推理部署和后训练,服务于门店客服、决策等业务流程。在政务领域,AI应用正从简单问答向覆盖数百种业务场景发展。

随着AI时代到来,开发者在技术创新中的角色日益重要。未来,鲲鹏昇腾将通过提供技术赋能、算力资源支持和实践操作机会,降低行业和开发者使用AI技术的门槛,助力AI技术普惠化发展。