当地时间5月14日消息,谷歌DeepMind推出用于设计高级算法的编程AI Agent—AlphaEvolve。这款智能体具备独立创造全新计算机算法的能力,并能直接将这些算法应用于谷歌庞大的计算基础设施中。
利用大型语言模型设计更好的算法
AlphaEvolve融合了谷歌Gemini大型语言模型与进化算法策略,实现了算法的自动测试、优化与迭代升级。简单来说,它能够自动改进和进化,通过不断的调整和优化,变得更加高效。
目前,该系统已在谷歌数据中心、芯片设计及人工智能训练系统等领域完成部署,显著提升了运行效率,并成功破解了困扰学术界数十年的数学难题。
该系统在谷歌先前FunSearch项目的研究基础上,其创新之处在于对整个代码库进行了优化,而非局限于单一函数的改进。这标志着人工智能在应对科学挑战和解决日常计算问题时,具备了开发复杂算法的能力。
优化计算生态系统
事实上,AlphaEvolve已在谷歌内部运行了超过一年时间,其间成果斐然。AlphaEvolve开发的一种算法现已被集成到谷歌的Borg集群管理系统之中,借助这一调度启发式算法,使得谷歌全球算力利用率得以提升0.7%。在谷歌庞大规模的计算环境中,这一效率的提升具有极其重要的意义。
AlphaEvolve甚至对自身运行所依赖的系统进行了优化。通过改进用于训练Gemini模型的矩阵乘法内核,该操作的速度提升了23%,整体训练时间缩短了1%。对于在大规模计算集群上运行的人工智能系统而言,这一效率的提升意味着可观的能源与资源节约。
此外,AlphaEvolve的应用并未止步于数据中心领域。它还对谷歌的硬件设计进行了优化,成功消除了张量处理单元(TPU)中关键算术电路的冗余位。TPU设计团队已验证这一改进的有效性,其成果将应用于下一代芯片设计之中。
谷歌DeepMind研究员亚历山大·诺维科夫表示:“我们成功将关键内核的实际运行时间缩短了23%,从而在整个Gemini训练流程中实现了1%的端到端效率提升。”
AlphaEvolve设计的算法,主要专门针对“搁浅资源”问题设计——即那些因内存等某一资源耗尽而无法充分利用剩余CPU等资源的机器。AlphaEvolve的解决方案价值显著,其生成的代码简洁明了,工程师可以轻松理解、调试并部署。
AlphaEvolve系统融合了Gemini Flash和Gemini Pro这两款Gemini语言模型,它们协同工作,针对现有代码提出修改建议。随后,自动化评估器会对这些修改进行测试并打分,最成功的算法将指引下一轮的进化过程。
谷歌DeepMind研究员马捷·巴洛格表示:“我们方法中的一个关键理念是,专注于具有明确评估器的问题。对于任何提出的解决方案或代码片段,我们都能自动验证其有效性并衡量其质量,这使我们能够建立起快速且可靠的反馈循环来提升系统性能。”
AlphaEvolve数学计算能力显著提升
AlphaEvolve不仅解决了长期困扰专家的数学难题,还推动了现有技术的进步。该系统设计了一种基于梯度的优化程序,发现了多种新的矩阵乘法算法。其中一项突破性成果打破了自1969年以来未被超越的数学记录。
矩阵乘法分块(tiling)问题
巴洛格指出:“尽管AlphaEvolve是一种通用技术,但其成果已超越专门用于矩阵乘法的AlphaTensor系统。特别是在4×4矩阵计算中,AlphaEvolve发现的算法首次超越了斯特雷森算法,这一突破自斯特雷森以来未曾实现。”研究显示,AlphaEvolve优化了14种矩阵乘法算法。
AlphaEvolve解决“亲吻数问题”
此外,AlphaEvolve在数学分析、几何、组合数学和数论等领域也展现了强大能力。系统在75%的开放性问题中达到了现有技术水平,并在20%的案例中取得更优成果。
其中一项成就体现在“亲吻数问题”上。该问题源于1694年牛顿和大卫・格雷戈里的讨论,简单来说,就是在不同维度的空间中,一个球体最多能与几个相同球体接触且不发生重叠。AlphaEvolve通过算法成功找到了一种593个球体的配置方案,打破了此前592个球体的记录。
目前AI辅助科学研究,潜力巨大。前段时间,华人学者Weiguo Yin借助OpenAI的o3-mini-high模型,破解了50年未解数学难题——完成了q=3的一维J_1-J_2 q态Potts模型的精确求解。这是首个非平凡数学证明。该成果不仅解决了长期未解的数学难题,还为物理领域诸多问题提供了新见解。