我们的同学最近在 48GB... agentzh 2025-04-10 20:03:03 我们的同学最近在 48GB 显存的英伟达 L40S 显卡上测试了一下阿里的 QWQ-32B AWQ 大模型,30 并发下吞吐量有 900 多 token 每秒。下图中有测试结果详情。qwenai创造营