📹 我专门录制了完整的视频教学,并提供答疑服务,🔍 让你不必为复杂的环境配置和出错没人指导而烦恼 😵💫
💡购买后包含最新版本的软件包和我们自己录制的详细视频教程 😊(实操讲解,并非网上那种一笔带过、语焉不详,新手看了还是一头雾水的流量视频❌ )
注意,软件支持电脑Windows10、11系统,英伟达显卡至少4GB显存
V4升级指南
如果你是用过V4以前版本版的老用户,那么肯定可以轻松的完成训练和推理,因为相比V1,V2在操作页面上几乎没有区别。下面你只要了解一下有哪些新功能就好了。
V4新特性
1.v4修复了v3非整数倍上采样可能导致的电音问题,原生输出48k音频防闷(而v3原生输出只有24k)。作者认为v4是v3的平替,更多还需测试。
V3新特性
1.音色相似度更像,需要更少训练集来逼近本人(不训练直接使用底模的模式下音色相似性提升更大)
2.GPT合成更稳定,重复漏字(根据测试集实验指标)更少,也更容易跑出丰富情感
3.比v2更忠实于参考音频。微调场景下,v2比v3更受训练集整体平均影响,然后带一些参考音频的引导。
V2新特性
切分&降噪&打标&校对
1.自动填充路径
2.funasr增加粤语,whisper增加韩语和粤语标注功能。funasr的粤语标注更为准确
3.whisper可选推理精度,float16可以带来更快的推理速度
预处理
1.中文改为G2PW处理以优化多音字效果,但处理速度变慢了
2.优化了英文多音字效果,处理速度也变快了
训练
1.全新底膜,训练集增加到5k小时
2.增加韩粤两种语言
3.训练所需数据集更少
推理
1.zero shot效果大幅增强
2.中日英韩粤5个语种均可跨语种合成
3.对低音质参考音频合成出来音质更好
4.更好的文本前端,中英文加入多音字优化
5.增加语速调节
6.增加音色融合
本站所有资源均经过测试,完全放心使用💯