Marco-o1:面向开放式解决方案的开放式推理模型 OneFlow 2024-12-01 22:34:21 大模型日报 ai前沿动态 【Marco-o1:面向开放式解决方案的开放式推理模型】链接:网页链接论文概述:Marco-o1模型通过结合CoT微调、MCTS和新的推理策略(包括迷你步骤和反思机制),显著提升了大型语言模型的推理能力,尤其在处理开放式问题和翻译俚语方面表现突出,但MCTS奖励函数的设计仍需改进。