如何实现声音克隆？

Python 深度学习AI – 声音克隆、声音模仿，是一个三阶段的深度学习框架，允许从几秒钟的音频中创建语音的数字表示，并用它来调节文本到语音模型，该模型经过培训，可以概括到新的声音。

环境准备与安装

原始英文版地址：

中文二次开发版（本文使用该版本）：

pycharm环境下载：

conda虚拟环境：

FFmpeg ：

模型文件：

在电脑系统上安装 FFmpeg 工具

下载完成后将其解压到一个目录后在系统的环境变量中添加该目录
打开新的cmd中查看是否安装成功
ffmpeg -version

使用打开项目目录后，创建时使用conda的Python 3.9虚拟环境

创建完成后，在cmd中查看现有的虚拟环境，并进入刚刚创建的虚拟环境

conda env list

activate pythonProject1

进入环境后在进行安装pip所需依赖，并使用国内源进行安装实现下载加速

在虚拟环境下安装pytorch

回到pycharm中，将模型导入到项目目录下，把目录复制黏贴到项目中

修改一行代码，在 synthesizer/utils/symbols.py 文件中

修改为：
_characters = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz12340!'(),-.:;? '

之后在terminal中启动工具箱

使用音频合成工具箱

知乎、CSDN、开源中国、思否、掘金、哔哩哔哩、腾讯云

本文使用文章同步助手同步
附录：
文本分类数据集https://github.com/fate233/toutiao-text-classfication-dataset