WavTokenizer：40个令牌每秒的SOTA离散声码器模型，用于音频语言建模，能够以极小的数据量高效表示语音、音乐和音频

爱可可-爱生活
2024-09-05 08:31:55

【WavTokenizer：40个令牌每秒的SOTA离散声码器模型，用于音频语言建模，能够以极小的数据量高效表示语音、音乐和音频】'SOTA Discrete Codec Models With Forty Tokens Per Second for Audio Language Modeling' GitHub: github.com/jishengpeng/WavTokenizer 音频编码语言模型声码器音频处理