Agent系统性能评估工具：多框架下Agent模型的基准测试工具，可测试不同Agent系统在自定义推理基准上的表现，支持并行处理以加速结果获取

爱可可-爱生活
2024-08-11 09:49:50

【Agent系统性能评估工具：多框架下Agent模型的基准测试工具，可测试不同Agent系统在自定义推理基准上的表现，支持并行处理以加速结果获取】'agent_reasoning_benchmark' GitHub: github.com/aymeric-roucher/agent_reasoning_benchmark 智能代理基准测试性能评估