Omni-MATH：专为评估大型语言模型在奥林匹克数学竞赛级别上的数学推理能力而设计的全面挑战性基准测试，包含4428个竞赛级问题，覆盖33个以上子领域和10个难度级别

爱可可-爱生活
2024-09-19 17:10:45

【Omni-MATH：专为评估大型语言模型在奥林匹克数学竞赛级别上的数学推理能力而设计的全面挑战性基准测试，包含4428个竞赛级问题，覆盖33个以上子领域和10个难度级别】'Omni-MATH - The official repository of the Omni-MATH benchmark.' GitHub: github.com/KbsdJames/Omni-MATH 数学竞赛基准测试大型语言模型奥林匹克数学