#小米首个推理大模型开源#，全面提升推理能力

36氪
2025-05-01 15:49:21

【小米首个推理大模型开源，全面提升推理能力】
财联社报道，据“小米大模型”公众号消息，今天，小米开源首个为推理（Reasoning）而生的大模型「XiaomiMiMo」，联动预训练到后训练，全面提升推理能力。在数学推理（AIME24-25）和代码竞赛（LiveCodeBenchv5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

随着DeepSeek-R1引发业界强化学习(RL)共创潮，DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下，MiMo-7B 的数学&代码领域的强化学习潜力显著领先。

此前据IT之家报道，@小米技术官微3月17日发文称，小米大模型团队在音频推理领域取得突破性进展。受 DeepSeek-R1 启发，团队率先将强化学习算法应用于多模态音频理解任务，仅用一周时间便以 64.5% 的 SOTA 准确率登顶国际权威的 MMAU 音频理解评测榜首，现同步开源。