VALL-E X_免费音频声音克隆工具 _ 酷库博客

VALL-E X_免费音频声音克隆工具第3张插图

VALL-E X_免费音频声音克隆工具

你认识高歌吗?

2023年9月7日

字数：836，阅读约3分钟

1.5K+

VALL-E X是一个强大而创新的多语言文本转语音（TTS）模型，最初由微软发布。虽然微软在他们的研究论文中提出了该概念，但并未发布任何代码或预训练模型。我们认识到了这项技术的潜力和价值，复现并训练了一个开源可用的VALL-E X模型。我们很乐意与社区分享我们的预训练模型，让每个人都能体验到次世代TTS的威力。

VALL-E X_免费音频声音克隆工具第5张插图

VALL-E X模型的最大特点是能够在仅3秒内实现声音克隆，将任何人的声音转换成语音。这项技术的应用非常广泛，比如可以用于电影、广告、电子游戏等领域，也可以用于智能客服和教育等领域。无论是为了娱乐还是商业用途，VALL-E X都是一个非常有价值的技术工具。

本地安装

使用pip安装，推荐使用Python 3.10，CUDA 11.7 ~ 12.0，PyTorch 2.0+

此处内容已隐藏，请评论后刷新页面查看

注意：如果需要制作prompt，需要安装 ffmpeg 并将其所在文件夹加入到环境变量PATH中

第一次运行程序时，会自动下载相应的模型。如果下载失败并报错，请按照以下步骤手动下载模型。

（请注意目录和文件夹的大小写）

1.检查安装目录下是否存在checkpoints文件夹，如果没有，在安装目录下手动创建checkpoints文件夹（./checkpoints/）。

2.检查checkpoints文件夹中是否有vallex-checkpoint.pt文件。如果没有，请从这里手动下载vallex-checkpoint.pt文件并放到checkpoints文件夹里。

3.检查安装目录下是否存在whisper文件夹，如果没有，在安装目录下手动创建whisper文件夹（./whisper/）。

4.检查whisper文件夹中是否有medium.pt文件。如果没有，请从这里手动下载medium.pt文件并放到whisper文件夹里。

温馨提示： 本文最后更新于2023年9月7日 09:08，若内容或图片失效，请在下方 留言或联系 酷库博客站长。

文件下载

文件名：

VALL-E-X.zip

运行环境：

Android/PC

文件大小：

14.80MB

下载方式：

更新时间：2023-09-07 09:08:21

THE END

本文作者：你认识高歌吗?
本文链接： https://zxki.cn/7485.html
版权声明：本站提供的一切软件、教程和内容信息仅限用于学习和研究目的；不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络收集整理，如果您喜欢该程序和内容，请支持正版，购买注册，得到更好的正版服务。我们非常重视版权问题，如有侵权请邮件与我们联系处理。敬请谅解！

VALL-E X 音频声音克隆

评论共6条

欢迎您留下宝贵的见解！

提交

请登录后查看评论内容

目录

播放音乐
切换上一首
切换下一首

复制图片
复制图片地址

深色模式
轉為繁體
前往顶部
前往底部

按住ctrl可打开默认菜单

音乐已暂停

网络技术爱好者的栖息之地,让我们的技术更上一层楼!

网址发布页

站点声明

联系站长