Imagination推新一代 E 系列 GPU,加速边缘 AI 渗透
14 小时前 / 阅读约7分钟
来源:集微网
4月29日,纳芯微推出一款基于全国产供应链的车规级SerDes芯片组。从晶圆到封测全部采用国产供应链,无对外采购,采用兼容性更强的HSMT公有协议。

2025年以来,生成式 AI领域的一个显著发展趋势就是向边缘侧快速渗透,AI手机、AI PC、AI眼镜、AIoT等应用的热度不断增加,乃至有人将2025年定义为边缘生成式AI的应用元年。然而,在边缘侧潜力被不断挖掘的同时,网络延迟、数据安全以及隐私保护等问题也逐渐凸显。这就需要不断推进硬软件技术,以满足AI模型市场新的需求。今日(5月8日),Imagination 公司推出了面向边缘AI运算的新一代E系列GPU IP,INT8/FP8算力可在2到200 TOPS的范围内扩展,为边缘应用提供了新的通用且可编程的解决方案。

边缘AI新风口将至

调研机构Gartner预测,到2026年全球将有80%的企业使用生成式AI,50%的边缘部署将包含AI。边缘AI作为一种通过设备本地化处理数据的技术,受到越来越多的支持。对此,Imagination中国区技术总监艾克指出,边缘AI凭借独特的技术架构与部署模式,在安全隐私、实时响应、能源效率等领域展现出显著优势,正在成为推动智能化变革的关键力量。

在安全隐私层面,边缘AI将数据处理从云端下沉至本地设备或边缘节点,数据无需长途传输至远程服务器,有效降低了数据在传输过程中被截获、篡改或泄露的风险。尤其在医疗、金融等对数据保密性要求极高的领域,敏感信息可在本地完成分析处理,数据的安全性更高。

在实时要求方面,边缘AI无需等待数据往返云端,直接在边缘侧完成分析与指令输出,极大缩短了延迟,对即时响应要求更高的场景,如工业自动化、智能交通等领域,可以确保任务的高效执行,满足对实时性的苛刻要求。

在能源效率与可持续发展方面,边缘AI减少了数据的长距离传输与云端大规模计算,可以降低能耗。数据中心的冷却、服务器运行等环节均需消耗大量电力,边缘AI分布式处理数据的模式,减少了对高能耗云端计算资源的依赖。

移动GPU有何核心优势?

移动GPU作为专为便携式设备及嵌入式系统优化的高性能计算单元,在边缘AI领域展现出日益显著的性能优势。从计算效率层面来看,移动GPU具备高度并行化的计算架构,其内部集成了大量专为矩阵运算和向量运算优化的计算核心,能够同时处理海量的数据计算任务。在功耗控制方面,相较于传统的桌面级GPU或CPU,移动GPU在设计之初就充分考虑了移动设备和边缘计算场景对功耗的严格限制,能够在提供强大计算能力的同时,将功耗控制在极低水平。此外,Imagination公司产品管理副总裁 Kristof Beets强调,相对于在边缘AI领域同样有着广泛应用的NPU而言,移动GPU还具有更高的通用性。

首先,移动GPU基于通用计算架构设计,可以同时支持图形渲染、视频编解码及AI推理等多样化任务。其次,移动GPU采用可编程着色器核心,可以支持动态调整计算单元的分配比例,在处理高分辨率视频流时,GPU可分配更多资源用于图像处理;而在运行AI推理任务时,则可快速切换至矩阵运算模式。第三,相比NPU的专用硬件加速单元,GPU的通用性使其能通过软件更新适配新兴算法,例如快速支持新提出的轻量化神经网络架构等。

“NPU与我们新推出的E系列GPU之间,一个重要的区别就在于——NPU 是为支持一些特定AI应用而设计,一旦出现了新的应用,NPU处理不了,这项任务就不得不被交给CPU去处理,CPU在处理这些交回的任务时往往会产生较大延迟,对性能的影响也很大。Imagination则在E系列GPU的管线当中整合了可编程的AI加速引擎。因此,从原则上讲,移动GPU不存在某个处理不了的AI任务,也就不会出现不得不交给其他的处理单元兜底的情况。这对用户应对快速更新迭代的AI行业十分重要。”Kristof Beets表示。

Kristof Beets还表示,GPU在软件工具与生态上更具优势。Imagination的策略是支持市面上被广泛使用的接口和工具,如Vulkan、OpenCL 和TensoRT等。公司花费了大量精力进行优化工作,可以确保不同AI工具和接口与公司的硬件可以更好地进行配合。此外,行业内熟悉GPU编程的人才很多。相对而言却短缺熟悉NPU编程的人才。这使 GPU在AI生态系统上拥有更大的优势。

E系列助力边缘AI新突破

Imagination公司在以往D系列的基础上,推出新一代面向边缘AI运算的E系列GPU IP,为边缘AI应用提供了更多的新选择。据了解,E系列GPU有两项核心创新:一是Neural Cores(神经核)最高可扩展至200 TOPS(INT8/FP8),可以显著提升AI计算性能;二是嵌入创新的Burst Processors(爆发式处理器)架构设计,使边缘应用中平均功耗效率提升35%。

具体而言,E系列延续了Imagination GPU一贯强大的图形处理能力,包括对光线追踪的支持。在此基础上,每个GPU核都深度集成了低精度、高能效的AI加速能力,构建出计算密度极高的神经核,使其性能可扩展至200 TOPS(INT8/FP8),AI性能较前代D系列提升400%。

另一方面,E系列引入全新的爆发式处理器(Burst Processors)技术。它是非常深度地集成在 GPU当中的一个处理单元,改变了GPU原本的指令调度方式,在执行爆发式数据处理时,所有计算都会尝试去利用爆发处理器的能力,尽可能多地重复利用和共享。这样可以减少很多不必要的计算开销,实现能效提升。据介绍,在AI推理、游戏和用户界面等工作负载下,平均功耗效率可以提升35%。

Kristof Beets进一步指出,未来随着边缘AI应用的增长,实时性和多模态处理需求如对数据、图像、音频、文字的处理需求,将会更多。在这一方面,GPU解决方案也更具优势。“因为无论是什么样的工作负载,本质上都是在利用GPU解决方案的高灵活性。这种支持多个神经网络同时运行的多任务处理能力,非常适用于GPU的多核技术。NPU在执行高并发处理方面,却会受到很多限制。”Kristof Beets强调。