Marco-o1:面向开放式解决方案的开放式推理模型

  • OneFlow
  • 2024-12-01 22:34:21
大模型日报 ai前沿动态

【Marco-o1:面向开放式解决方案的开放式推理模型】

链接:网页链接
论文概述:Marco-o1模型通过结合CoT微调、MCTS和新的推理策略(包括迷你步骤和反思机制),显著提升了大型语言模型的推理能力,尤其在处理开放式问题和翻译俚语方面表现突出,但MCTS奖励函数的设计仍需改进。
Marco-o1:面向开放式解决方案的开放式推理模型Marco-o1:面向开放式解决方案的开放式推理模型