DeepSeek-Prover-V1.5:基于强化学习和蒙特卡洛树搜索的证明助手,专为Lean 4定理证明设计,优化了训练和推理过程

  • 爱可可-爱生活
  • 2024-08-21 22:44:14
【DeepSeek-Prover-V1.5:基于强化学习和蒙特卡洛树搜索的证明助手,专为Lean 4定理证明设计,优化了训练和推理过程】'DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search' GitHub: github.com/deepseek-ai/DeepSeek-Prover-V1.5 定理证明 强化学习 蒙特卡洛树搜索
DeepSeek-Prover-V1.5:基于强化学习和蒙特卡洛树搜索的证明助手,专为Lean 4定理证明设计,优化了训练和推理过程DeepSeek-Prover-V1.5:基于强化学习和蒙特卡洛树搜索的证明助手,专为Lean 4定理证明设计,优化了训练和推理过程