8 块 H200 GPU 卡在同一台... agentzh 2025-02-07 14:11:21 8 块 H200 GPU 卡在同一台 1.5G 内存的大机器上,确实很气势磅礴的感觉 好多 VRAM 和 TensorCore 呀 后面可以多跑一些中小规模的大模型了。大模型的吞吐量和延时才是王道啊。 ai创造营 H200 LLM