日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

<td id="gup6s"><code id="gup6s"><small id="gup6s"></small></code></td>

<strike id="gup6s"><code id="gup6s"></code></strike>

<fieldset id="gup6s"><table id="gup6s"></table></fieldset>

<menu id="gup6s"><form id="gup6s"></form></menu>

<span id="gup6s"><i id="gup6s"></i></span>

搜索

分享

QQ空間 QQ好友新浪微博微信

【原】“最強(qiáng) AI 聲優(yōu)”駕到！10秒復(fù)刻聲音，連本人都分不出來(lái)！

網(wǎng)羅燈下黑 2025-04-15 發(fā)布于河南

展開(kāi)全文

之前我不是做 B 站嗎？錄視頻解說(shuō)的時(shí)候真的挺麻煩，老是讀錯(cuò)字，還費(fèi)時(shí)間。

所以我一直對(duì)語(yǔ)音克隆工具關(guān)注有加，最近又發(fā)現(xiàn)一個(gè)新升級(jí)的克隆利器，讓它幫我念臺(tái)詞，大家聽(tīng)聽(tīng)效果怎么樣？

我去，我自己聽(tīng)了都愣住了。也太像了吧。。。

我讓媳婦聽(tīng)了之后，一開(kāi)始她還真沒(méi)聽(tīng)出來(lái)，不僅音色一致，語(yǔ)調(diào)有抑揚(yáng)頓挫，停頓也都非常自然。

再對(duì)比一下原視頻解說(shuō)聲音，怎么樣，這個(gè) AI 幫忙念的解說(shuō)詞和原聲相比，也許最大的差別就是沒(méi)有背景音樂(lè)了吧。

AI 克隆了我的聲音后，還能用來(lái)說(shuō)粵語(yǔ)、英語(yǔ)。生成的其它方言和語(yǔ)言不僅完全保持了原有的音色，說(shuō)的也非常自然、流暢。

比之前體驗(yàn)過(guò)的，包括目前市面不少聲音克隆 AI 工具效果不要好太多。

好了，該引出正主了，我用的是 MiniMax Audio 剛上新的 Speech-02 模型克隆的。

說(shuō)起來(lái) MiniMax，也是國(guó)內(nèi) AI 六小龍之一的實(shí)力選手。海螺 AI 就是 MiniMax 公司的產(chǎn)品之一。

不過(guò)這次國(guó)內(nèi)版的 Speech-02 模型還沒(méi)有上線，也不支持聲音克隆，所以大家只能先用海外版了，官網(wǎng)「需魔法」：

https://www./audio

內(nèi)置語(yǔ)音庫(kù)、克隆聲音快

MiniMax Audio 內(nèi)置了豐富的語(yǔ)音庫(kù)，差不多有 300 多種，各種語(yǔ)言和各種年齡、風(fēng)格的都有，質(zhì)量非常高，都可以直接拿來(lái)用。

這么多，都?jí)蚪o一部電視劇所有演員配音了吧。

英文咱就不聽(tīng)了，聽(tīng)?zhēng)讉€(gè)中文的。

如果需要克隆新的聲音，就要點(diǎn)擊「Create your Voice Clone」，也就是創(chuàng)建克隆聲音。

然后上傳一段音頻或者自己錄音。至少 10 秒以上吧，也不需要太長(zhǎng)，一二十秒就差不多了。

如果上傳的聲音有背景音樂(lè)，這肯定會(huì)影響克隆聲音效果的。

而 MiniMax Audio 還支持上傳聲音的同時(shí)去除背景音，勾選那個(gè)「去除背景音」就行。

這點(diǎn)真的很贊，不然還得另外找工具把背景音樂(lè)和人聲分離。

最后選擇需要生成的語(yǔ)音種類(lèi)，再點(diǎn)擊「Convert」就開(kāi)始克隆了。

我從點(diǎn)擊開(kāi)始到生成克隆的聲音真的快，大概也就 10 秒時(shí)間。

真的挺快！不禁感嘆，語(yǔ)音克隆這個(gè)玩法現(xiàn)在是真的有手就會(huì)，完全是 0 門(mén)檻了。

支持生成 30多種語(yǔ)言，可調(diào)節(jié)音色

這還只是第一步，聲音克隆之后，它會(huì)存到語(yǔ)音庫(kù)。

如果想要克隆出的聲音說(shuō)出其他話，還得再輸入文本，然后在語(yǔ)音庫(kù)里選擇剛才克隆的聲音就可以了。

在文本生成聲音的時(shí)候，還可以對(duì)生成的聲音效果進(jìn)行調(diào)節(jié)，比如速度、音量等等。

什么帶情緒的也可以，比如高興、悲傷、生氣等等。

在左下角生成語(yǔ)言選項(xiàng)那里，可以看到，它除了可以生成中文普通話外，還能生成粵語(yǔ)方言以及英語(yǔ)、日語(yǔ)等 30 多種語(yǔ)言。

而且不管你克隆的聲音說(shuō)什么語(yǔ)言的，都能生成其它不同的語(yǔ)言。

所以在生成的時(shí)候有兩個(gè)模型可供選擇：Speech-02-hd、Speech-02-turbo。

這兩個(gè)有什么區(qū)別呢?

Speech-02-hd 主要是用在聲音克隆方面，生成一些小語(yǔ)種聲音的話，建議使用 Speech-02-turbo。

生成不同的語(yǔ)言時(shí)注意不要選錯(cuò)。

我用它克隆了幾個(gè)大家都算比較熟悉的聲音，然后再和原聲對(duì)比，大家就更能體驗(yàn)到 MiniMax Audio 的聲音克隆能力有多強(qiáng)了！

第一組：董卿聲音

第二組：王明軍朗讀《三體》

第三組：步非煙聲音

怎么樣，這一番對(duì)比下來(lái)，有沒(méi)有一種那根本不是 AI 克隆的聲音，它就是原聲的感覺(jué)？

因?yàn)閷?shí)在是太像了，甚至都基本一模一樣了。

PDF 、網(wǎng)頁(yè)鏈接轉(zhuǎn)語(yǔ)音

MiniMax 除了支持文字轉(zhuǎn)語(yǔ)音之外，還可以支持 PDF 文檔和網(wǎng)頁(yè)鏈接直接轉(zhuǎn)語(yǔ)音。

得，又給我們省了一步操作。。。

現(xiàn)在公眾號(hào)不是支持聽(tīng)文章了嘛？是方便不少，你看也有小伙伴在用這個(gè)功能，但我老覺(jué)得它聽(tīng)起來(lái)比較生硬。

那我就把這篇文章的鏈接放進(jìn)去。

大家再聽(tīng)下，是不是比公眾號(hào)自帶的朗讀效果要好多了，雖然說(shuō)情感缺乏一些起伏，但是音色是真的像，這是真的得服。

你要知道，這僅用了 10 秒的語(yǔ)料，僅花了 10 秒就能達(dá)到的效果。

同時(shí)我也發(fā)現(xiàn)，雖然它識(shí)別網(wǎng)頁(yè)鏈接后的文字有空行，但它生成語(yǔ)音的時(shí)候會(huì)智能忽略掉，也就是中間不會(huì)因?yàn)橛锌招卸ｎD那么長(zhǎng)時(shí)間。

另外，它還支持長(zhǎng)文本模式，最高可輸入 20 萬(wàn)字符。

這差不多是一本有聲書(shū)的體量了，當(dāng)然這么多的字符必須得另外「加錢(qián)」了。

目前的話，普通用戶每天登錄可免費(fèi)領(lǐng) 4000 積分，可支持能夠制作出 5 分鐘的音頻，如果只是淺玩體驗(yàn)一下，也差不多夠了。

結(jié)語(yǔ)

體驗(yàn)了 MiniMax Audio 的 Speech-02 模型后，不得不說(shuō)又把語(yǔ)音克隆又往前推上了新高度。

無(wú)論是聲音克隆的精準(zhǔn)度、多語(yǔ)言支持的廣泛性，還是生成語(yǔ)音的自然流暢度，都遠(yuǎn)超市面上大多數(shù)同類(lèi)產(chǎn)品。

最關(guān)鍵的是，0 門(mén)檻就能做出這種效果，要知道之前還都得用 GPT-SoVITS 這種開(kāi)源工具手搓出來(lái)，現(xiàn)在直接全省了。。。

目前到這個(gè)階段，在音色克隆這方面，大家基本上已經(jīng)卷得差不多了。

再往下的新的突破點(diǎn)，那大概就是大模型根據(jù)文本包含的語(yǔ)義來(lái)自行調(diào)整語(yǔ)音情感和腔調(diào)了，到了那個(gè)時(shí)候，可能我們就真的無(wú)法再分辨真人和 AI 的語(yǔ)音了。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：網(wǎng)羅燈下黑 > 《待分類(lèi)》

舉報(bào)/認(rèn)領(lǐng)

0條評(píng)論

請(qǐng)遵守用戶評(píng)論公約

類(lèi)似文章 更多

網(wǎng)羅燈下黑

關(guān)注對(duì)話

TA的最新館藏

MCP 很火，但下次別用了
我用AI給女兒做了定制專(zhuān)屬故事：MiniMax MCP 生成實(shí)戰(zhàn)手記！
??GitHub萬(wàn)星項(xiàng)目DUIX實(shí)測(cè)：AI女友的“超能力”讓我驚掉下巴！??
“最強(qiáng) AI 聲優(yōu)”駕到！10秒復(fù)刻聲音，連本人都分不出來(lái)！
AI把B站UP主的飯碗也砸了
可以跟 PhotoShop 說(shuō)再見(jiàn)了

喜歡該文的人也喜歡更多

熱門(mén)閱讀換一換