怎么樣?雖說還做不到定制版 AI 語音的以假亂真,但這吐字清晰,字正腔圓,有停頓有語音的曉曉,可比國內(nèi)大多數(shù) AI 合成音都要強(qiáng)。 坊間難免有這樣的評(píng)價(jià)——合成語音哪家強(qiáng)?微軟 AI 找曉曉。 實(shí)際上,單就中文而言,「大聲朗讀」還有其他語調(diào),甚至還有港臺(tái)腔。 只不過這樣的效果是在 Edge 瀏覽器上實(shí)現(xiàn),雖說可以在線聽,但想導(dǎo)出朗讀的內(nèi)容就很麻煩。 所以去年我又研究了一番,扒到了封裝好的「大聲朗讀」,可以直接錄制下載轉(zhuǎn)換好的語音。 以及,那篇的重頭戲,我們自己去微軟云 Azure 上申請(qǐng)賬號(hào),不僅說話風(fēng)格更多,你還能逐字逐句的調(diào)整停頓、發(fā)音、語調(diào)、語速、音高、音量。 一個(gè)文本,你可以用多種合成音(多個(gè)人)以不同風(fēng)格討論的形式念出來,比如這樣子: 或者這樣: 當(dāng)時(shí)我還做過對(duì)比,微軟 Azure 上這個(gè) AI 文本轉(zhuǎn)語音的功能,可比某些收費(fèi)項(xiàng)目都有「人」味。 唯一的門檻,停在了「申請(qǐng)賬號(hào)」這一步上,我簡(jiǎn)單給大家說說怎么回事。 微軟拒絕白嫖 之前微軟 Azure 的這個(gè)服務(wù)是注冊(cè)賬號(hào)后,是能免費(fèi)使用 30 天的,而且還不需要綁定信用卡,30 天后,只要綁定信用卡就能免費(fèi)使用一年。 但不知道是不是因?yàn)榘祖螄L鮮的人太多了,去年微軟 Azure 改了規(guī)則,直接要求綁卡才能使用。 后來聽小伙伴說,有的時(shí)候綁卡還會(huì)跳到「即付定價(jià)」的界面,我猜大概率是這個(gè)卡已經(jīng)綁過了。 我實(shí)測(cè)了一下,拿曾經(jīng)綁過的信用卡再綁另一個(gè)賬號(hào),得到了下面的跳轉(zhuǎn)提示。 所以綁卡成了用微軟 Azure 最大的攔路虎,當(dāng)然,你要是有張未綁定的新信用卡,這條路還是能走通的。 但信用卡這玩意,真不一定誰都有,何況綁定以后它還和谷歌云之類的國外服務(wù)一樣,哪怕是限期免費(fèi),還是會(huì)先暫扣你 1 美元的保證金,這讓很多小伙伴覺得不安。。。 當(dāng)時(shí)有這么一條留言,說「沒有信用卡,還眼饞,怎么整?」。 后來我就留心了一下關(guān)于微軟 Azure 文本轉(zhuǎn)語音服務(wù)二次開發(fā)的工具,有這種 Python 打包的小工具。 缺點(diǎn)是只支持中文不說,支持語音量還少,還無法實(shí)時(shí)試聽文字內(nèi)容,更沒辦法像開頭說的那樣逐字逐句的調(diào)教語音,讓微軟語音的魅力大打折扣。 而效果最好的,是這個(gè)上星期才剛剛發(fā)布的小工具,雖然是用易語言寫的,但把微軟云官網(wǎng)上所支持的語言、語音、風(fēng)格都加了進(jìn)去。 更關(guān)鍵的是,這個(gè)微軟語音合成助手是支持 SSML 的,啥意思?之前所說的逐字逐句 DIY 語音的功能,本質(zhì)上就是加了 SSML 代碼。 利用 SSML 代碼,你可以為語音增添情緒、語調(diào)、音量這些東西,不過在官網(wǎng)可以通過動(dòng)動(dòng)鼠標(biāo)的方式實(shí)現(xiàn)。 可代碼這玩意,哪怕再低也是一座山,肯定會(huì)勸退不少小伙伴。 不過我看到 SSML 后,突發(fā)奇想,折騰出了一套無需代碼,無需綁卡白嫖微軟語音轉(zhuǎn)文字的新方案。 白嫖新思路 目光還得暫且回到上面兩個(gè)小工具上,雖然不知道兩位作者是怎么開發(fā)的,但這些功能和微軟云文本轉(zhuǎn)語音頁面的 Demo 是一致的。 支持更換語言,支持更換語音,支持調(diào)整風(fēng)格,以及支持 SSML 代碼。 所以這個(gè) Demo 就是微軟云官網(wǎng)的宣傳展示窗口,還可以實(shí)時(shí)播放,實(shí)時(shí)調(diào)整,除了不能下載,和上面兩個(gè)小工具并無差別,即都不能像官網(wǎng)那樣通過點(diǎn)擊來 DIY 語音。 但微軟云的這個(gè) DIY 功能,也是有 Demo 的呀。 除了字典功能無法嘗試,別的停頓、發(fā)音、改語速啥的都能正常使用,細(xì)心的小伙伴應(yīng)該能看到左上角有「下載」兩個(gè)字,但點(diǎn)進(jìn)去又回到了注冊(cè)綁卡那一步。 別急,為了更好的向開發(fā)者展示 SSML 的魅力,在這個(gè) Demo 里可以把當(dāng)前配置都轉(zhuǎn)換成 SSML 語言格式。 我們只要「Ctrl+C」復(fù)制到之前那個(gè)微軟語音合成助手,就白嫖了絕大部分的功能,全程不用你手搓代碼,甚至不用登錄。 當(dāng)然,要是大家不想用易語言寫的工具,可以下載「Azure Speech Download」這個(gè)油猴腳本。 它能幫你在最開始的那個(gè) Demo 頁,多個(gè)下載語音的按鈕,點(diǎn)擊就保存到本地了。 我給大家聽聽我通過這種繞道的方式合成出來的語音,效果喜人。 結(jié)語 其實(shí)今天這個(gè)繞道而行的白嫖方案并不難,就是兩個(gè) Demo 和一個(gè)下載腳本的組合技而已。 撐死了,第二個(gè) Demo 藏的比較深不好發(fā)現(xiàn),而綁了卡的小伙伴又用不到,不過正好適合咱們這種又想嘗鮮,又不想綁卡的受眾。 而且你別小瞧了這個(gè)方案,要知道,最開始給大家介紹的那個(gè)能下載「大聲朗讀」的小軟件,在某寶賣 16 元。 而一個(gè)能享受這些 DIY 功能的賬號(hào),賣 166 元。 四舍五入,看了今天這篇文章的你立省一筆開支,付出的不過是多動(dòng)了幾下鼠標(biāo),多敲了幾下鍵盤。 微軟云合成語音的 Demo(最好 Chrome、Edge 打開,然后往下拉): https://azure.microsoft.com/zh-cn/services/cognitive-services/text-to-speech 能 DIY 的 Demo(過段時(shí)間會(huì)要求刷新,不過不影響玩): https://speech.microsoft.com/audiocontentcreation 至于剩下的,我整理好放后臺(tái)了,上次還沒嘗鮮的小伙伴,趕緊去試試吧。 |
|