IT之家 6 月 30 日消息,据 The Information 报道,OpenAI 工程师在内部透露,公司已通过一系列全新的系统底层优化,成功将 AI 模型的推理(运行)成本降低了 50% 以上。
据IT之家了解,推理成本指的是模型在实际运行并响应用户请求时所消耗的计算资源。
此次优化主要得益于现有服务器资源利用率的提升,而非依赖新增计算芯片的投入。这使得运行其 AI 系统所需的英伟达芯片更少,这些节省的成本可用于降低 API 定价或提高用户使用限额。
简体中文 English