五秒克隆你的声音

已整合训练好的模型,不需要特别高的配置和IT水平

环境要求

python3.7及以上

理论支持Windows 7及以上 (建议 win8+,过老版本不保证兼容性)

亲测win2012,win10完美运行

如果在用 pip 方式安装的时候出现 ERROR: Could not find a version that satisfies the requirement torch==1.9.0+cu102 (from versions: 0.1.2, 0.1.2.post1, 0.1.2.post2) 这个错误可能是 python 版本过低,3.9 可以安装成功

安装步骤

请勾选add python to path,否则需要手动配置环境变量

中文语音克隆工具MockingBird 第5张插图

请保持网络畅通,若断网报错请重新执行安装依赖.bat

使用教程

1.browse选择一段3-15秒的语音,wav格式,最好单声道,吐字清晰,没有杂音,不宜过长

亲测网课直播录屏,发语音,在安静条件录音等音质较好,而在公共环境比如舞台,KTV等录音音质较差

不是所有语音都能够完美克隆,亲测在网课放老师的声音以假乱真,但像麦小兜派蒙雷米等萝莉音效果不理想

可以使用音频编辑工具例如au进行预处理降噪

中文语音克隆工具MockingBird 第6张插图

如图所示,频谱规则的音频克隆效果较好

中文语音克隆工具MockingBird 第7张插图

2.在右上角输入文本,仅支持中文,不要有阿拉伯数字,英文请使用谐音自行解决哈

3.选择vocoder,推荐Griffin-Lim,点击Synthesize and vocode试听,之后点击export导出音频

中文语音克隆工具MockingBird 第8张插图