WavTokenizer:40个令牌每秒的SOTA离散声码器模型,用于音频语言建模,能够以极小的数据量高效表示语音、音乐和音频

  • 爱可可-爱生活
  • 2024-09-05 08:31:55
【WavTokenizer:40个令牌每秒的SOTA离散声码器模型,用于音频语言建模,能够以极小的数据量高效表示语音、音乐和音频】'SOTA Discrete Codec Models With Forty Tokens Per Second for Audio Language Modeling' GitHub: github.com/jishengpeng/WavTokenizer 音频编码 语言模型 声码器 音频处理
WavTokenizer:40个令牌每秒的SOTA离散声码器模型,用于音频语言建模,能够以极小的数据量高效表示语音、音乐和音频WavTokenizer:40个令牌每秒的SOTA离散声码器模型,用于音频语言建模,能够以极小的数据量高效表示语音、音乐和音频