腾讯技术团队对DeepSeek开源的DeepEP通信框架进行了深度优化,在各种网络环境下均实现了显著的性能提升。测试结果显示,优化后的框架在RoCE网络环境下性能提升了100%,在IB网络环境下提升了30%。这一改进为企业进行AI大模型训练提供了更加高效的解决方案,并获得了DeepSeek的公开致谢,称赞其为一次“巨大加速”的代码贡献。