IT之家 5 月 7 日消息,当地时间 5 月 5 日,英特尔宣布成为唯一在 MLPerf Client v0.6 基准测试中实现全 NPU 支持的企业。
英特尔表示,该结果标志着行业首个针对客户端 NPU 的大语言模型(LLM)性能标准化评估。测试数据显示,英特尔酷睿 Ultra 200 处理器在 GPU 和 NPU 上的输出速度远超人类平均阅读速度。
英特尔客户端 PC 产品营销副总裁兼总经理丹尼尔・罗杰斯(Daniel Rogers)表示,“我们很荣幸能够引领行业,实现客户端 PC 平台的全 NPU 加速和领先 GPU 性能。”
AMD | 英特尔 | |
平台 | 华硕 Zenbook S 16 | 华硕 Zenbook S 14 |
型号 | UM5606WA | UX5406SA |
CPU | AMD 锐龙 AI HX 370 | 酷睿 Ultra 9 288V |
BIOS 日期 | 2025 年 3 月 21 日 | 2025 年 2 月 26 日 |
BIOS 版本 | UM5606WA.317 | UX5406SA.306 |
内存 | 32GB LPDDR5,7500MHz | 32GB LPDDR5,8533 MHz |
显卡 | AMD Radeon 890M | 英特尔 Arc 140V |
存储 | 1TB | 1TB |
操作系统 | Windows 11 专业版 x64 |
英特尔表示,在基于 Llama 2 7B 模型的四项内容生成与摘要测试中,英特尔在 NPU 和内置 Arc GPU 上均展现领先性能:
创 NPU 最快响应速度,首个词元生成仅需 1.09 秒(首 token 延迟)
实现 NPU 最高吞吐量 18.55 tokens / 秒
GPU 首 token 生成速度超越竞品
IT之家注:MLPerf Client 由 MLCommons 联盟成员(含英特尔、AMD、微软、英伟达、高通)联合开发,首次突破以 GPU 为核心的测试模式,新增专用 NPU 基准评估。