当前位置: 首页> 腾云科技> 正文

文本转语音系统Spark-TTS:支持零样本语音克隆与细粒度控制

Spark-TTS是一款先进的文本转语音系统,凭借其零样本语音克隆和细粒度语音控制能力,该系统基于Qwen2.5构建,简化了音频生成流程,提高了效率,并支持多语言生成,尤其适合有声读物制作。

亮点提要:

零样本语音克隆:无需特定训练数据即可生成说话者声音,适合个性化应用。

细粒度语音控制:用户可精确调整语速和音高,满足不同需求。

跨语言生成:支持多种语言,保持高自然度和准确性,扩展全球适用性。

详情入口:

https://github.com/SparkAudio/Spark-TTS