【DeepSeek-Prover-V1.5:基于强化学习和蒙特卡洛树搜索的证明助手,专为Lean 4定理证明设计,优化了训练和推理过程】'DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search' GitHub: github.com/deepseek-ai/DeepSeek-Prover-V1.5
定理证明 强化学习 蒙特卡洛树搜索