腾讯技术团队优化了DeepSeek开源的DeepEP通信框架,在RoCE网络环境下性能提升达100%,IB网络环境下也有30%的提升。该优化通过智能化带宽分配、解决CPU控制瓶颈、引入QP内时序锁机制,大幅提高了多GPU间的通信效率。目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目,展现出强大的通用性。