日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

超簡單教你用Python克隆聲音(以卷福為例)

 伊伊爸 2022-07-02 發(fā)布于上海

語音克隆是這兩年比較火的深度學(xué)習(xí)應(yīng)用,它允許從幾秒鐘的音頻中學(xué)習(xí)對(duì)象的說話方式和音調(diào),并使用它來生成新的語音。

下面來看看我使用 SV2TTS 訓(xùn)練模仿卷福閱讀下面這句話的效果:

She is beginning to get many wrinkles around her eyes.

訓(xùn)練集:

克隆、模仿效果(She is beginning to get many wrinkles around her eyes.):

效果不錯(cuò),如果不知道它是Python生成的,還以為真的是卷福念的。

下面就來教大家如何使用 Real-Time-Voice-Cloning 項(xiàng)目克隆語音并生成自己想要的語句。

1.準(zhǔn)備

大家可以前往 Real-Time-Voice-Cloning 項(xiàng)目下載這個(gè)項(xiàng)目的代碼以及預(yù)訓(xùn)練完成的模型。(注意,需要Python 3.6以上才能運(yùn)行該項(xiàng)目):
https://github.com/CorentinJ/Real-Time-Voice-Cloning

如果你的網(wǎng)絡(luò)速度比較差,下載不了 github 項(xiàng)目及其預(yù)訓(xùn)練模型,可以在 Python 實(shí)用寶典 公眾號(hào)后臺(tái)回復(fù) 克隆語音 下載完整項(xiàng)目代碼及預(yù)訓(xùn)練模型。

下載完項(xiàng)目代碼后,你還需要下載兩個(gè)重要依賴:

  • PyTorch(> = 1.0.1)
    https://pytorch.org/get-started/locally/

  • ffmpeg
    https:///download.html

安裝 PyTorch

其中,PyTorch的官方指南已經(jīng)寫得很清楚了,大家根據(jù)自己的需求安裝即可。

安裝 ffmpeg

ffmpeg 的安裝我們已經(jīng)在這篇文章詳細(xì)地講過:Python 多種音樂格式轉(zhuǎn)換(批量)實(shí)戰(zhàn)教程,在此重新講解一下各個(gè)系統(tǒng)的安裝指南:

Mac (打開終端(Terminal), 用 homebrew 安裝):

brew install ffmpeg --with-libvorbis --with-sdl2 --with-theora

Linux:

apt-get install ffmpeg libavcodec-extra

Windows:

1. 進(jìn)入以下鏈接,點(diǎn)擊 windows 對(duì)應(yīng)的圖標(biāo),進(jìn)入下載界面點(diǎn)擊 download 下載按鈕:
http:///download.html#build-windows

2. 解壓下載好的zip文件到指定目錄
3. 將解壓后的文件目錄中 bin 目錄(包含 ffmpeg.exe )添加進(jìn) path 環(huán)境變量中

安裝模塊依賴

安裝完成以上兩個(gè)重要依賴后,在終端、命令行中進(jìn)入項(xiàng)目目錄中,安裝Python依賴:

pip install -r requirements.txt

這命令會(huì)安裝所有 requirements.txt 中的所有依賴。完成以上依賴的安裝后,就可以進(jìn)行下一步了。

2.下載預(yù)訓(xùn)練模型(可選)

如果你用的是我們提供的項(xiàng)目文件,你就不需要再進(jìn)行這一步了,因?yàn)榘杨A(yù)訓(xùn)練的模型都已經(jīng)放進(jìn)去了。

如果你沒有用Python實(shí)用寶典提供的項(xiàng)目代碼,你還需要去下載預(yù)訓(xùn)練的模型:https://github.com/CorentinJ/Real-Time-Voice-Cloning/wiki/Pretrained-models

下載完成后解壓 pretrained.zip 分別將對(duì)應(yīng)的模型放入項(xiàng)目對(duì)應(yīng)的位置中:

encoder\saved_models\pretrained.pt
synthesizer\saved_models\pretrained\pretrained.pt
vocoder\saved_models\pretrained\pretrained.pt

3.試一下克隆語音

隨便選取一段你想要克隆的人的語音,大概30秒左右,放入項(xiàng)目文件夾中。然后在該文件夾中運(yùn)行命令:

python demo_cli.py

如果一切正常,它會(huì)出現(xiàn)讓你選擇訓(xùn)練語音文件:

圖片


此時(shí)輸入你準(zhǔn)備好的一段語音,等待它訓(xùn)練完成后,它會(huì)讓你輸入想要模仿的文字:

圖片


比如上圖中,我輸入了:

She is beginning to get many wrinkles around her eyes.

程序生成完畢后會(huì)自動(dòng)念出克隆結(jié)果,如果你沒有聽見克隆結(jié)果,沒關(guān)系,程序會(huì)將其保存在當(dāng)前文件夾下,命名為 demo_output_xx.wav。

雙擊打開這個(gè)文件,就是它生成的語音克隆結(jié)果啦,聽聽看,是不是你想要的效果?

如果沒有達(dá)到你的理想效果,請(qǐng)檢查一下訓(xùn)練集是否有雜音、時(shí)間夠不夠長、有沒有其他人的介入,這些因素都可能導(dǎo)致克隆效果不理想。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多