Convbased-Studio

项目简介

本项目专注于训练高质量的RVC（Retrieval-based Voice Conversion）模型底模，为语音转换任务提供强大的基础模型支持。通过476个不同说话人的多样化数据集，我们训练出了具有优异收敛性能的编码器和解码器模型。

✨ 主要特性

大规模多说话人训练: 基于476个说话人的丰富数据集
优异的收敛性能: 经过35天深度训练，提供更稳定的训练收敛能力
高质量编码器/解码器: 为RVC模型训练提供强大的预训练底模
完整的训练流程: 包含数据预处理、模型训练、评估等完整工具链

🎯 模型特点

训练规模

说话人数量: 476个不同说话人
训练时长: 35天连续训练
模型类型: 编码器 + 解码器架构

性能优势

更快的训练收敛速度
更稳定的训练过程
更好的语音质量输出

📥 模型下载

预训练模型下载

声码器	32k	40k	48k
HiFi-GAN MRF	🚧 即将发布	🚧 即将发布	🚧 即将发布
HiFi-GAN NSF	🚧 即将发布	🚧 即将发布
HiFi-GAN	🚧 即将发布	🚧 即将发布	🚧 即将发布
RefineGAN	🚧 即将发布	🚧 即将发布	🚧 即将发布
SiFiGAN	🚧 即将发布	🚧 即将发布	🚧 即将发布

💡 使用建议: 推荐使用 HiFi-GAN NSF 48k 模型，具有最佳的音质表现和训练稳定性。

训练数据集

本模型使用以下高质量中文语音数据集进行训练：

数据集名称	时长（小时）	描述
data_aishell	178	中文普通话语音识别数据集
data_thchs30	30	清华大学中文语音数据集
primewords_md_2018	178	中文语音合成数据集
VCTK	44	英文多说话人数据集
四川方言	4	四川话方言数据
闽南语	3	闽南话方言数据
粤语	3	粤语方言数据
温州方言	7	温州话方言数据
噪声	20	噪声环境语音数据

🚀 快速开始

环境要求

Python 3.11+
CUDA 11.0+ (推荐使用GPU训练)
8GB+ GPU显存 (推荐16GB+)

依赖安装

# 安装项目依赖
pip install -r requirements.txt

# 或使用安装脚本
./run-install.sh

数据处理

具体查看 data_preprocessing.ipynb

模型训练

具体查看 train.ipynb

🛠️ 使用说明

配置文件

底模 convbased_v1 使用目前只有48k采样率

🙏 致谢

感谢 Convbased 为本项目提供计算服务，Convbased 致力于推进中文语音合成技术与云计算的发展。

📄 许可证

本项目采用 MIT 许可证，详见 LICENSE 文件。

🤝 贡献

欢迎提交Issues和Pull Requests来帮助改进项目！

📧 联系方式

如有问题或建议，请通过以下方式联系：

提交GitHub Issue
发送邮件至项目维护者

📕引用

RVC

rvc-cli

Applio

本模型致力于推进中文语音合成技术的发展，该底模已用于微调大部分模型于 Convbased 提供使用

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
algorithm		algorithm
configs		configs
models		models
predictors		predictors
train		train
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
config.py		config.py
extract.py		extract.py
preparing_files.py		preparing_files.py
preprocess.py		preprocess.py
preprocessing.ipynb		preprocessing.ipynb
run-install.sh		run-install.sh
slicer.py		slicer.py
train.ipynb		train.ipynb
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Convbased-Studio

项目简介

✨ 主要特性

🎯 模型特点

训练规模

性能优势

📥 模型下载

预训练模型下载

训练数据集

🚀 快速开始

环境要求

依赖安装

数据处理

模型训练

🛠️ 使用说明

配置文件

🙏 致谢

📄 许可证

🤝 贡献

📧 联系方式

📕引用

About

Uh oh!

Releases

Packages

Languages

License

Convbased/Convbased-Studio

Folders and files

Latest commit

History

Repository files navigation

Convbased-Studio

项目简介

✨ 主要特性

🎯 模型特点

训练规模

性能优势

📥 模型下载

预训练模型下载

训练数据集

🚀 快速开始

环境要求

依赖安装

数据处理

模型训练

🛠️ 使用说明

配置文件

🙏 致谢

📄 许可证

🤝 贡献

📧 联系方式

📕引用

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages