LLaMA-O1:一个大型推理模型框架,用于 PyTorch 和 HuggingFace 的训练、推理和评估,集成了蒙特卡洛树搜索(MCTS)、自我对弈强化学习、PPO、AlphaGo Zero 的双

LLaMA-O1:一个大型推理模型框架,用于 PyTorch 和 HuggingFace 的训练、推理和评估,集成了蒙特卡洛树搜索(MCTS)、自我对弈强化学习、PPO、AlphaGo Zero 的双

【LLaMA-O1:一个大型推理模型框架,用于 PyTorch 和 HuggingFace 的训练、推理和评估,集成了蒙特卡洛树搜索(MCTS)、自我对弈强化学习、

2024-11-08浏览详情

mcts-llm:集成了蒙特卡洛树搜索(MCTS)和提示工程技术的轻量级项目,旨在提高大型语言模型(LLMs)的性能

mcts-llm:集成了蒙特卡洛树搜索(MCTS)和提示工程技术的轻量级项目,旨在提高大型语言模型(LLMs)的性能

【mcts-llm:集成了蒙特卡洛树搜索(MCTS)和提示工程技术的轻量级项目,旨在提高大型语言模型(LLMs)的性能】'mcts-llm - MCTS + LLM + Pro

2024-10-14浏览详情

DeepSeek-Prover-V1.5:基于强化学习和蒙特卡洛树搜索的证明助手,专为Lean 4定理证明设计,优化了训练和推理过程

DeepSeek-Prover-V1.5:基于强化学习和蒙特卡洛树搜索的证明助手,专为Lean 4定理证明设计,优化了训练和推理过程

【DeepSeek-Prover-V1.5:基于强化学习和蒙特卡洛树搜索的证明助手,专为Lean 4定理证明设计,优化了训练和推理过程】'DeepSeek-Prover

2024-08-21浏览详情

正在拼命加载中

我是有底线的

没有更多的页面可以加载啦!