HuggingFace 推理端点现在也支持在... 斌叔OKmath 2024-12-02 08:55:34 HuggingFace 推理端点现在也支持在 CPU 服务器上部署由 llama.cpp 支持的实例这是朝着更广泛的低成本云 LLM 可用性迈出的第一步,特别是随着新的 AI 友好型指令集的兴起。