FluxKits:Flux系列模型工具集,包含两个主要部分:1) Flux-mini,一个3.2B参数的文生图模型,是从12B的Flux-dev模型蒸馏而来,大幅降低硬件需求;2) Flux-NPU,

FluxKits:Flux系列模型工具集,包含两个主要部分:1) Flux-mini,一个3.2B参数的文生图模型,是从12B的Flux-dev模型蒸馏而来,大幅降低硬件需求;2) Flux-NPU,

【FluxKits:Flux系列模型工具集,包含两个主要部分:1) Flux-mini,一个3.2B参数的文生图模型,是从12B的Flux-dev模型蒸馏而来,大幅降低硬

2024-12-04浏览详情

Awesome-Efficient-MoE:专注于高效混合专家(MoE)模型相关研究的精选资源集合,收录了MoE模型及其高效变体的研究论文和资源。该仓库涵盖了稀疏MoE、MoE压缩、剪枝、量化、分解和

Awesome-Efficient-MoE:专注于高效混合专家(MoE)模型相关研究的精选资源集合,收录了MoE模型及其高效变体的研究论文和资源。该仓库涵盖了稀疏MoE、MoE压缩、剪枝、量化、分解和

【Awesome-Efficient-MoE:专注于高效混合专家(MoE)模型相关研究的精选资源集合,收录了MoE模型及其高效变体的研究论文和资源。该仓

2024-11-28浏览详情

DeepCompressor:大型语言模型和扩散模型的模型压缩工具箱,支持8bit以内的任何整数和浮点数据类型的假量化,例如INT8、INT4和FP4_E2M1,具有高效压缩和加速模型推理的特点

DeepCompressor:大型语言模型和扩散模型的模型压缩工具箱,支持8bit以内的任何整数和浮点数据类型的假量化,例如INT8、INT4和FP4_E2M1,具有高效压缩和加速模型推理的特点

【DeepCompressor:大型语言模型和扩散模型的模型压缩工具箱,支持8bit以内的任何整数和浮点数据类型的假量化,例如INT8、INT4和FP4_E2

2024-11-17浏览详情

正在拼命加载中

我是有底线的

没有更多的页面可以加载啦!