Deepseek 宣布开源代码库,为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA
2025-02-24

DeepSeek今日宣布启动开源周,首个开源代码库为FlashMLA,这是一个针对Hopper GPU优化的高效MLA解码内核。FlashMLA专为处理可变长度序列而设计,旨在降低推理成本,目前已投入生产。