介绍

零发/少量TTS是一个开源的声音克隆与文本转语音项目,支持仅需5秒语音样本即可进行即时合成,或使用1分钟数据进行模型微调以提升相似度与真实感。项目跨语言支持中文、英语、日语、韩语、粤语等,集成WebUI工具,包含语音伴奏分离、自动训练集分割、ASR标注等功能,帮助用户快速构建训练数据集和GPT/SoVITS模型。代码结构清晰,适合开发者学习TTS技术、声音克隆、模型微调及AI语音工具链实践。

使用说明

阅读压缩包内的README.md文件。

图片演示

零发TTS模型源码 1分钟训练声音克隆-1

Logo

这里是“一人公司”的成长家园。我们提供从产品曝光、技术变现到法律财税的全栈内容,并连接云服务、办公空间等稀缺资源,助你专注创造,无忧运营。

更多推荐