英特尔宣布实现 MLPerf Client 0.6 基准测试首个完全 NPU 支持,酷睿 Ultra 200 处理器较 AMD 展现端侧 AI 性能优势
21 小时前 / 阅读约2分钟
来源:IT之家
英特尔表示,该结果标志着行业首个针对客户端 NPU 的大语言模型(LLM)性能标准化评估。测试数据显示,英特尔酷睿 Ultra 200 处理器在 GPU 和 NPU 上的输出速度远超人类平均阅读速度。

IT之家 5 月 7 日消息,当地时间 5 月 5 日,英特尔宣布成为唯一在 MLPerf Client v0.6 基准测试中实现全 NPU 支持的企业。

英特尔表示,该结果标志着行业首个针对客户端 NPU 的大语言模型(LLM)性能标准化评估。测试数据显示,英特尔酷睿 Ultra 200 处理器在 GPU 和 NPU 上的输出速度远超人类平均阅读速度。

英特尔客户端 PC 产品营销副总裁兼总经理丹尼尔・罗杰斯(Daniel Rogers)表示,“我们很荣幸能够引领行业,实现客户端 PC 平台的全 NPU 加速和领先 GPU 性能。”

测试配置


AMD英特尔
平台华硕 Zenbook S 16华硕 Zenbook S 14
型号UM5606WAUX5406SA
CPUAMD 锐龙 AI HX 370酷睿 Ultra 9 288V
BIOS 日期2025 年 3 月 21 日2025 年 2 月 26 日
BIOS 版本UM5606WA.317UX5406SA.306
内存32GB LPDDR5,7500MHz32GB LPDDR5,8533 MHz
显卡AMD Radeon 890M英特尔 Arc 140V
存储1TB1TB
操作系统Windows 11 专业版 x64

英特尔表示,在基于 Llama 2 7B 模型的四项内容生成与摘要测试中,英特尔在 NPU 和内置 Arc GPU 上均展现领先性能:

  • 创 NPU 最快响应速度,首个词元生成仅需 1.09 秒(首 token 延迟)

  • 实现 NPU 最高吞吐量 18.55 tokens / 秒

  • GPU 首 token 生成速度超越竞品

IT之家注:MLPerf Client 由 MLCommons 联盟成员(含英特尔、AMD、微软、英伟达、高通)联合开发,首次突破以 GPU 为核心的测试模式,新增专用 NPU 基准评估。