WavTokenizer:40个令牌每秒的SOTA离散声码器模型,用于音频语言建模,能够以极小的数据量高效表示语音、音乐和音频 爱可可-爱生活 2024-09-05 08:31:55 【WavTokenizer:40个令牌每秒的SOTA离散声码器模型,用于音频语言建模,能够以极小的数据量高效表示语音、音乐和音频】'SOTA Discrete Codec Models With Forty Tokens Per Second for Audio Language Modeling' GitHub: github.com/jishengpeng/WavTokenizer 音频编码 语言模型 声码器 音频处理