小米公司宣布开源首个推理大模型Xiaomi MiMo,该模型参数规模达7B。在数学推理和代码竞赛公开测评中,MiMo表现优异,超越了包括OpenAI的o1-mini和阿里Qwen的QwQ-32B-Preview在内的多个知名模型。这一成就得益于MiMo在预训练和后训练阶段的多层面创新,如合成约200B tokens的推理数据,进行三阶段训练,以及强化学习优化等。目前,用户可在HuggingFace平台上获取MiMo-7B全系列模型。