Omni-MATH-Rule：一个全面的数学问题评估工具，专为测试大型语言模型在奥林匹克数学竞赛级别的推理能力而设计，包含4428个竞赛级问题，覆盖33个细分领域和10个难度级别

爱可可-爱生活
2025-01-01 10:45:47

【Omni-MATH-Rule：一个全面的数学问题评估工具，专为测试大型语言模型在奥林匹克数学竞赛级别的推理能力而设计，包含4428个竞赛级问题，覆盖33个细分领域和10个难度级别】'Omni-MATH is a comprehensive and challenging benchmark specifically designed to assess LLMs' mathematical reasoning at the Olympiad level.' GitHub: github.com/KbsdJames/omni-math-rule 数学竞赛奥林匹克数学大型语言模型 AI创造营