Omni-MATH-Rule:一个全面的数学问题评估工具,专为测试大型语言模型在奥林匹克数学竞赛级别的推理能力而设计,包含4428个竞赛级问题,覆盖33个细分领域和10个难度级别

  • 爱可可-爱生活
  • 2025-01-01 10:45:47
【Omni-MATH-Rule:一个全面的数学问题评估工具,专为测试大型语言模型在奥林匹克数学竞赛级别的推理能力而设计,包含4428个竞赛级问题,覆盖33个细分领域和10个难度级别】'Omni-MATH is a comprehensive and challenging benchmark specifically designed to assess LLMs' mathematical reasoning at the Olympiad level.' GitHub: github.com/KbsdJames/omni-math-rule 数学竞赛 奥林匹克数学 大型语言模型 AI创造营
Omni-MATH-Rule:一个全面的数学问题评估工具,专为测试大型语言模型在奥林匹克数学竞赛级别的推理能力而设计,包含4428个竞赛级问题,覆盖33个细分领域和10个难度级别