Omni-MATH:专为评估大型语言模型在奥林匹克数学竞赛级别上的数学推理能力而设计的全面挑战性基准测试,包含4428个竞赛级问题,覆盖33个以上子领域和10个难度级别

  • 爱可可-爱生活
  • 2024-09-19 17:10:45
【Omni-MATH:专为评估大型语言模型在奥林匹克数学竞赛级别上的数学推理能力而设计的全面挑战性基准测试,包含4428个竞赛级问题,覆盖33个以上子领域和10个难度级别】'Omni-MATH - The official repository of the Omni-MATH benchmark.' GitHub: github.com/KbsdJames/Omni-MATH 数学竞赛 基准测试 大型语言模型 奥林匹克数学
Omni-MATH:专为评估大型语言模型在奥林匹克数学竞赛级别上的数学推理能力而设计的全面挑战性基准测试,包含4428个竞赛级问题,覆盖33个以上子领域和10个难度级别Omni-MATH:专为评估大型语言模型在奥林匹克数学竞赛级别上的数学推理能力而设计的全面挑战性基准测试,包含4428个竞赛级问题,覆盖33个以上子领域和10个难度级别