minRLHF:基于minGPT构建的最小化RLHF实现,包含HappyGPT(0.8M参数的正向情感推文生成模型)和文本摘要项目。该项目简洁易懂,提供完整的训练和推理功能,适合学习和研究RLHF技术 爱可可-爱生活 2024-12-04 08:20:06 【minRLHF:基于minGPT构建的最小化RLHF实现,包含HappyGPT(0.8M参数的正向情感推文生成模型)和文本摘要项目。该项目简洁易懂,提供完整的训练和推理功能,适合学习和研究RLHF技术】'Minimal RLHF implementation built on top of minGPT.'GitHub: github.com/ttumiel/minRLHF机器学习 RLHF GPT 人工智能