DeepSeek开源周第四阶段活动于2月27日正式揭晓,此次开源的核心是三项优化并行策略。DeepSeek在Github平台上深入解析了DeepSeek-V3和R1模型背后的并行计算优化技术,展示了团队在计算和通信优化方面的精细工作,旨在最大化利用GPU能力。其中,DualPipe是一项引人注目的技术,它实现了V3/R1模型训练中计算与通信重叠的双向流水线并行算法。这种算法能够消除传统方法中的“流水线气泡”,即设备在某些时刻的空闲等待,从而显著提升效率。DualPipe的开发团队中,包括了DeepSeek的创始人梁文锋。