DeepSeek今日宣布启动开源周,首个开源代码库为FlashMLA,这是一个针对Hopper GPU优化的高效MLA解码内核。FlashMLA专为处理可变长度序列而设计,旨在降低推理成本,目前已投入生产。