Agent系统性能评估工具:多框架下Agent模型的基准测试工具,可测试不同Agent系统在自定义推理基准上的表现,支持并行处理以加速结果获取

  • 爱可可-爱生活
  • 2024-08-11 09:49:50
【Agent系统性能评估工具:多框架下Agent模型的基准测试工具,可测试不同Agent系统在自定义推理基准上的表现,支持并行处理以加速结果获取】'agent_reasoning_benchmark' GitHub: github.com/aymeric-roucher/agent_reasoning_benchmark 智能代理 基准测试 性能评估
Agent系统性能评估工具:多框架下Agent模型的基准测试工具,可测试不同Agent系统在自定义推理基准上的表现,支持并行处理以加速结果获取