DeepSeek致谢腾讯大模型网络提速技术方案贡献,助力大模型通信性能提升30%
2 天前

腾讯技术团队优化了DeepSeek开源的DeepEP通信框架,在RoCE网络环境下性能提升达100%,IB网络环境下也有30%的提升。该优化通过智能化带宽分配、解决CPU控制瓶颈、引入QP内时序锁机制,大幅提高了多GPU间的通信效率。目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目,展现出强大的通用性。