泄漏的DeepSeek R2信息揭示其运用自主AI基础设施实现性能提升
3 天前

据知名AI业内人士@iruletheworldmo透露,DeepSeek在成功推出R1模型后,正筹备发布性能大幅提升的全新R2模型。该模型在华为Ascend 910B芯片集群、潜在的Atlas 900以及DeepSeek内部分布式训练框架的支持下,加速器利用率高达82%,实现了512 PetaFLOPS的FP16性能,接近exaFLOP计算能力的一半。