OpenR:一个开源框架,专为大型语言模型提供高级推理能力,支持数据生成、策略训练和多种搜索策略,让机器更聪明地理解和解决问题,提供了 MATH-APS 数据集和 MATH-psa 流程奖励模型,并且
2024年10月14日

OpenR:一个开源框架,专为大型语言模型提供高级推理能力,支持数据生成、策略训练和多种搜索策略,让机器更聪明地理解和解决问题,提供了 MATH-APS 数据集和 MATH-psa 流程奖励模型,并且

【OpenR:一个开源框架,专为大型语言模型提供高级推理能力,支持数据生成、策略训练和多种搜索策略,让机器更聪明地理解和解决问题,提供了 MATH-APS 数据集和 MATH-psa 流程奖励模