#小米首个推理大模型开源#,全面提升推理能力

  • 36氪
  • 2025-05-01 15:49:21
小米首个推理大模型开源,全面提升推理能力】
财联社报道,据“小米大模型”公众号消息,今天,小米开源首个为推理(Reasoning)而生的大模型「XiaomiMiMo」,联动预训练到后训练,全面提升推理能力。在数学推理(AIME24-25)和代码竞赛(LiveCodeBenchv5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

随着DeepSeek-R1引发业界强化学习(RL)共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下,MiMo-7B 的数学&代码领域的强化学习潜力显著领先。

此前据IT之家报道,@小米技术 官微3月17日发文称,小米大模型团队在音频推理领域取得突破性进展。受 DeepSeek-R1 启发,团队率先将强化学习算法应用于多模态音频理解任务,仅用一周时间便以 64.5% 的 SOTA 准确率登顶国际权威的 MMAU 音频理解评测榜首,现同步开源。
#小米首个推理大模型开源#,全面提升推理能力#小米首个推理大模型开源#,全面提升推理能力