14萬語音是必備的,以前介紹過,這里不再重復。
因為種種原因,用windows遠程登錄linux,在終端上使用vi編輯器及執(zhí)行命令行做試驗等不需要GUI的情形比較多,所以這里只介紹我在windows環(huán)境下的stardict配置。 stardict 近日推出3.0版本后,在windows下的運行也好像比較穩(wěn)定了,大概是新版的GTK-runtime的改進吧。 1,先下載stardict 主程序并安裝(新版集成了gtk rutime,不需要分別安裝) http://stardict./download.php 2,安裝字典 一般英漢詞典都是沒必要下載,目前值得下載的只有兩本辭典 Longman Dictionary of Contemporary English http://reciteword./stardict/babylon.php 美國傳統(tǒng)詞典[雙解](金山詞霸) http://reciteword./stardict/powerword.php 解壓到C:\Program Files\StarDict\dic目錄下 3, 自制發(fā)音音標詞典 可 惜這兩本辭典都不能準確顯示音標,而且大部分流行的詞典都采用英國發(fā)音而非美式發(fā)音。因此,這里我們用語音識別中常用到的[The CMU Pronouncing Dictionary]-CMU美國發(fā)音詞典(stardict的官網(wǎng)上的CMU American English spelling字典估計也是出于這個目的制作的,但是錯誤不少,漏了很多。CMU的發(fā)音字典源自http://www.speech.cs./cgi-bin/cmudict), 用stardict-editor打開文本文件CMUPD.txt, 按下build按鈕,瞬間就在同一個文件夾上制造了CMUPD.dict,CMUPD.idx,CMUPD.ifo三個文件。在C:\Program Files\StarDict\dic目錄下新創(chuàng)建一個文件夾,命名為CMUPD,并把剛才生成的三個文件轉移到CMUPD文件夾之中。最后把CMUPD 設置成最先顯示的字典即可。 stardict-editor http://fileblog./upload/200708/2007081725850703_750_17.rar tab分隔的文本文件 http://fileblog./upload/200708/2007082071923156_398_17.rar (尚未完全測試,可能會有細微的bug,待以后確認。記住這是美式發(fā)音用國際音標表示,和不少詞典的英式發(fā)音會有不小的差別。) #去年參加語音識別國際大會interspeech2006時候順便參觀了CMU(卡內基梅隆大學) FeedBack:
2007-09-21 11:15 | Yue Xiaoyong
我用的是ubuntu,沒有 startdict-editor,想請博主貢獻出來制作好的發(fā)音字典,謝謝,我的郵箱yuexiaoyong@yahoo.com
2007-09-21 18:51 | luodean
發(fā)音字典在stardict的主頁上可以下載:
http://stardict./Dictionaries_dictd-www.dict.org.php 少數(shù)重讀標記有待改進,對使用影響不大,以后再統(tǒng)一修改吧。 |
|