DeepCompressor:大型语言模型和扩散模型的模型压缩工具箱,支持8bit以内的任何整数和浮点数据类型的假量化,例如INT8、INT4和FP4_E2M1,具有高效压缩和加速模型推理的特点 爱可可-爱生活 2024-11-17 01:04:13 【DeepCompressor:大型语言模型和扩散模型的模型压缩工具箱,支持8bit以内的任何整数和浮点数据类型的假量化,例如INT8、INT4和FP4_E2M1,具有高效压缩和加速模型推理的特点】'Model Compression Toolbox for Large Language Models and Diffusion Models' GitHub: github.com/mit-han-lab/deepcompressor 模型压缩 人工智能 深度学习