音頻帶寬(Audio Bandwidth,AB)是指會議電話的音響裝置能夠處理或通過的一段頻率范圍。比如,音響的環(huán)繞聲道的帶寬是100Hz-7kHz,表明環(huán)繞聲道只通過頻率在100Hz(低音)和7kHz(高音的低段)之間的頻率。人耳能聽到的頻率范圍為20Hz-20kHz,但大部分有用的和可理解的信息的頻率在200Hz到3500Hz之間。所以會議電話的音頻帶寬與此相對應(yīng),也是200Hz到3500Hz之間。音頻帶寬用于描述組成復(fù)合信號的頻率范圍。音頻信號的頻帶越寬,所包含的音頻信號分量越豐富,音質(zhì)越好。 詞條應(yīng)用選股
編輯限制由于某些特性(例如噪聲和總失真)和音頻帶寬有關(guān),因此只有將解調(diào)信號占有的音頻頻段加以限制,才能獲得重復(fù)的輸出結(jié)果。 限制音頻帶寬可以通過在音頻測量設(shè)備之前接入限制頻帶的濾波器來實現(xiàn)。該濾波器可以加在測量設(shè)備內(nèi);在測量剩余哼聲和噪聲時,則只用低通濾波器。 接入的音頻測量設(shè)備(包括濾波器)其輸入阻抗不要影響接收機的輸出負(fù)載條件。 編輯擴展1.非盲目式高頻重建方法目前,非盲目式高頻重建法主要包括頻帶復(fù)制(Spectral Band Replication,SBR)法、簡化參數(shù)的帶寬擴展(Simplified Parameters Bandwidth Extension,SPBE)法、PlusV高頻重建法、Bark帶頻譜建模(Bark Band Spectrum Modeling,BBSM)、基于BBSM的簡化參數(shù)高頻重建和基于最小熵的音頻信號高頻重建法。 在編碼端,SBR方法首先借助正交鏡像濾波器(Quadrature Mirror Filter,QMF)將輸入信號劃分為64個子帶,并定義前32個子帶包含低頻信息,后32個子帶包含高頻信息。其次,對各高頻子帶進行諧波和噪聲屬性分析,最后將高頻各子帶的諧波和噪聲屬性及能量包絡(luò)參數(shù)隨同低頻信息參數(shù)一同寫入碼流。 在解碼端,首先借助QMF,將解碼后的低頻時域信號分為32個子帶;其次,將各低頻子帶信息復(fù)制到各高頻子帶;最后,根據(jù)解碼后高頻各子帶的諧波和噪聲屬性及能量包絡(luò)恢復(fù)高頻各子帶信息,即若某一高頻子帶為諧波屬性,則用正弦發(fā)生器生成該頻帶的時域信號;若該頻帶為噪聲屬性,則由白噪聲生成器生成該頻帶的時域信號。 通過上述原理介紹我們可以看出,SBR方法的主要優(yōu)點是直接將低頻子帶的信息復(fù)制到高頻子帶,并借助高頻子帶的諧波和噪聲屬性及能量包絡(luò)重建高頻信息。但其缺點是需對原始音頻信號進行分帶處理,并提取高頻子帶的諸多參數(shù),這使得復(fù)雜度和加入比特流的參數(shù)信息量很大。 在編碼端,SPBE方法首先對輸入音頻信號進行修正的離散余弦變換(Modified Discrete Cosine Trans.form,MDCT),將得到的一組MDCT系數(shù)等分到N個子帶中,并定義前N/2個子帶包含低頻信息,后N/2個子帶包含高頻信息;其次,利用各子帶中的MDCT系數(shù)計算各低頻子帶與各高頻子帶的相關(guān)系數(shù)及各高頻子帶能量;最后,將各高頻子帶的能量參數(shù)、高低頻子帶相關(guān)系數(shù)隨同低頻MDCT系數(shù)一同寫入碼流。 在解碼端,首先將解碼后的低頻時域信號分為N/2個子帶;其次,根據(jù)高低頻子帶相關(guān)系數(shù),判斷是否存在與高頻子帶相關(guān)的低頻子帶,如果有,則將對應(yīng)的低頻子帶信息復(fù)制到對應(yīng)的高頻子帶;如果沒有,則將對應(yīng)的高頻子帶填充隨機白噪聲;最后,利用高頻子帶能量信息調(diào)整時域幅度,完成高頻重建。 通過上述的原理可以看出,SPBE方法與SBR相比,避免了分帶處理,而是利用MDCT建立起的高低頻子帶相關(guān)性及高頻子帶能量進行低頻子帶信息復(fù)制或噪聲填充來實現(xiàn)高頻信息重建,該方法具有復(fù)雜度低和邊信息少的優(yōu)勢。 在編碼端,首先將輸入音頻信號的有效帶寬一分為二,并將高頻帶等分為N個子帶。然后依次檢測各高頻子帶是否存在類正弦峰值,如果存在,則記錄該峰值的能量及對應(yīng)頻率。接下來則去除各高頻子帶的類正弦峰值,使各高頻帶只剩下類噪聲成分,并分別計算每個高頻子帶的類噪聲能量。最后,將類正弦峰值的能量與其對應(yīng)的頻率及高頻各子帶類噪聲能量參數(shù)隨同低頻信息參數(shù)一同寫入碼流。 在解碼端,首先將高頻帶等分為N個子帶,然后用白噪聲填充各高頻子帶,并用解碼的高頻各子帶類噪聲能量調(diào)整備子帶能量。最后,利用解碼的類正弦峰值的能量及其所對應(yīng)的頻率,在各高頻子帶加入正弦峰值,完成最終的高頻信息重建。 通過上述原理分析可以看出,PlusV方法利用了音頻信號的高頻信息由噪聲和類正弦信號混合組成的特點。該方法主要以噪聲來填充高頻帶,這對于高頻帶以噪聲為主要成分的信號而言,高頻重建效果較好,人耳很難聽出解碼信號與輸入信號的差別。但是由于其重建所得的高頻頻譜并不精細,對于諧波成分多、噪聲成分少的音頻信號而言,難免會引入人工噪聲,人耳對此噪聲會有所感知,造成音頻質(zhì)量下降。 在編碼端,首先對輸入音頻信號進行FFT變換,并計算高頻帶與本地解碼的低頻帶信息之間的相關(guān)系數(shù);其次,將輸人信號的高頻幅度譜與本地解碼的低頻幅度譜分別按Bark尺度進行子帶劃分,并將高頻Bark子帶分為N個組,低頻前M個Bark子帶歸為一個組,這里N應(yīng)是的M倍數(shù)。最后,計算各高頻子帶組與低頻子帶組的能量比隨同低頻信息參數(shù)一同寫入碼流。 在解碼端,首先對低頻解碼信息進行采樣,并利用Bark尺度進行子帶劃分;其次,根據(jù)解碼的相關(guān)系數(shù)進行高低頻相關(guān)性判斷,當(dāng)相關(guān)系數(shù)小于給定閾值時,用隨機白噪聲填充高頻各Bark子帶;反之,將解碼的前M個低頻Bark子帶信息復(fù)制到各高頻子帶組;最后,根據(jù)解碼的高頻子帶組與低頻子帶組的能量比,對高頻Bark子帶的能量進行調(diào)整,完成最終的高頻重建。 通過上述原理分析可以看出,BBSM方法借助Bark尺度進行非均勻分帶,使得子帶寬度呈指數(shù)增長,避免了前面3種方法對頻帶進行均勻劃分的缺陷,有效減少了分帶數(shù)目及表示高頻信息的參數(shù)。但是,由于該方法使用一組相同的Bark帶低頻信息去重建各組Bark帶高頻信息,并沒有使用與高頻子帶相關(guān)性最大的低頻子帶去重建高頻信息,因此得到的不是最佳的重構(gòu)信息。 在編碼端,首先將輸人信號等分為N個子帶;其次,根據(jù)子帶能量差異和過零率,對相鄰兩幀信號相同低頻子帶進行相關(guān)性判斷,并提取相關(guān)性最強的M個低頻子帶,作為高頻重建單元;接著,比較相鄰兩幀高頻各子帶的能量差異,只有當(dāng)差異值大于給定門限時,才傳遞高、低頻子帶能量比;最終將提取的M個低頻子帶的索引值、高頻子帶的能量差異與高、低頻子帶能量比參數(shù)隨同低頻信息參數(shù)一同寫入碼流。 在解碼端,首先,將解碼的低頻信號等分為N/2個子帶;其次,利用相鄰兩幀高頻各子帶的能量差異進行頻帶復(fù)制判斷,當(dāng)差異值大于給定門限時,則將M個低頻子帶復(fù)制到高頻帶,并利用高、低頻子帶能量比對其進行能量調(diào)整得到高頻信息;反之,則填充隨機白噪聲得到高頻信息。 通過上述原理分析可以看出,此方法避免了BBSM中使用固定的低頻信息重建高頻信息的缺陷,通過選擇相關(guān)性最好的低頻子帶對高頻帶進行重建,進一步減少了表示高頻的參數(shù),有利于提升重建質(zhì)量。 在編碼端,輸入音頻信號經(jīng)FFT變換后被等分為N個子帶,將提取的高頻各子帶的包絡(luò)能量信息隨同低頻信息參數(shù)一同寫人碼流。 在解碼端,將信號等分為,N個子帶,低頻解碼信息填人對應(yīng)的低頻子帶,高頻子帶均賦為零值,同時加入直流信息,構(gòu)成一個全頻帶信號。經(jīng)IFFT變換后,得到時域信號。將此時域信號作為初始全頻帶信號,結(jié)合高頻包絡(luò)能量信息,用最小熵算法循環(huán)迭代不斷得到新的全頻帶信號。每次恢復(fù)出全頻帶信號后,都將其與初始全頻帶信號做相關(guān)性檢測,當(dāng)相關(guān)系數(shù)小于某個門限值時,迭代停止,此時恢復(fù)的全頻帶信號即為解碼信號。 通過上述原理分析可以看出,該方法利用了最小熵準(zhǔn)則來對低頻信息進行譜外推得到高頻信息,其核心思想是利用信息熵來度量信號的頻譜分辨率,通過求取最小信息熵來提高信號的頻譜分辨率,使得外推得到的高頻譜信息更加準(zhǔn)確。其重建音頻信號的高頻譜信息更加豐富,從而使得重建信號更加飽滿自然。但是,由于本方法沒有對高頻細節(jié)譜進行精確恢復(fù),當(dāng)處理高頻能量較強的信號時,難免會引入輕微的噪聲。 2.盲目式高頻重建方法目前,盲目式高頻重建法主要包括線性外推(Linear Extrapolation,LE)、有效高頻帶寬擴展(Effi-cient High-frequency Bandwidth Extension,EHBE)、混合信號外推(Hybrid Signal Extrapolation,HSE)和非線性預(yù)測等。 LE法利用音頻信號的對數(shù)幅度譜包絡(luò)呈近似線性遞減關(guān)系來進行高頻重建。 在解碼端的高頻重建中,需要恢復(fù)的高頻信息包括兩部分內(nèi)容,即高頻譜包絡(luò)和高頻譜細節(jié)。高頻譜包絡(luò)借助幅度譜的線性關(guān)系獲得,高頻譜細節(jié)通過復(fù)制低頻帶的諧波結(jié)構(gòu)獲得。具體步驟如下: 首先,對低頻解碼信號進行時頻變換得到其譜包絡(luò);其次,采用線性最小二乘法將該包絡(luò)在對數(shù)域擬合成一條直線,得到該直線的最佳斜率和截距;最后,將低頻譜信息進行復(fù)制得到高頻譜細節(jié),并利用擬合直線的斜率對高頻譜細節(jié)進行包絡(luò)衰減,完成最后的高頻重建。 通過上述原理分析可以看出,LE方法利用了強制譜包絡(luò)遞減的方法來保證重構(gòu)的高頻信息不會淹沒低頻信息,但當(dāng)實際的音頻頻譜包絡(luò)在對數(shù)域不呈下降趨勢時,重構(gòu)高頻信息將與原始譜有較大差別。 在解碼端的高頻重建中,EHBE法首先將低頻解碼的信號(截止頻率為)進行帶通濾波,得到此低頻解碼信號的最高八度音信號(截止頻率為起始頻率兩倍的帶限音頻信號f cu t),將其定義為基波。然后經(jīng)非線性手段產(chǎn)生基波B 1的二次諧波、三次諧波等一系列諧波,將包含這些諧波的信號記為。接著將信號S經(jīng)另一個帶通濾波器處理,得到所需的諧波集合,并將其作為重建高頻信息。這里,f hi gh為頻帶展寬后信號的截止頻率。最后調(diào)整此高頻信息的增益,并與低頻解碼信號結(jié)合,得到全頻帶音頻信號。 通過上述原理分析可以看出,EHBE法是一種基于八度音信號的高頻重建方法,其優(yōu)點是計算復(fù)雜度低,針對不同帶寬的信號,只需更改濾波器系數(shù)和諧波增益就可進行高頻重建。其缺點是,帶通濾波器的過渡帶會使八度音信號的截止頻率不精準(zhǔn),從而導(dǎo)致重建高頻信息的準(zhǔn)確性下降。 在解碼端的高頻重建中,HSE法首先對每幀低頻解碼信號進行線性預(yù)測,并利用預(yù)測系數(shù)將每幀信號進行前向和后向外推,以增加時域信號的長度。這樣做的目的是為了提高每幀信號的頻域分辨率,保證頻域外推的準(zhǔn)確性。其次,將增長的時域信號加窗,經(jīng)FFT變換得到頻域系數(shù),并對這些系數(shù)進行動態(tài)估計,得出截止頻率。在處理截止頻率未知或變化的音頻信號時,此操作避免了信號低頻譜與重建高頻譜之間產(chǎn)生譜間隙。最后,將FFT系數(shù)轉(zhuǎn)換到對數(shù)域進行線性預(yù)測,并利用預(yù)測系數(shù)外推得到高頻譜信息,完成最終的高頻重建。 通過上述原理分析可以看出,HSE法是一種時域外推和頻域外推相結(jié)合的高頻重建方法。由于截止頻率檢測模塊的存在,使得此方法適用于未知截止頻率或可變截止頻率音頻信號的高頻重建,從而擴大了應(yīng)用范圍。但是,如果此方法處理的是瞬態(tài)信號,如鼓聲等,增加樣點數(shù)的時域外推步驟將導(dǎo)致信號動態(tài)特性的丟失,從而在反變換后將無法精確恢復(fù)出瞬態(tài)信息。 在解碼端的高頻重建中,非線性預(yù)測法首先將截去高頻信息的時域信號進行分幀處理,并對相鄰兩幀的信號進行MDCT變換,得到低頻MDCT系數(shù);其次,求取此低頻MDCT系數(shù)的嵌入維和延遲量來重構(gòu)音頻非線性動力系統(tǒng)的相空間;接著在重構(gòu)相空間中,利用Lyapunov指數(shù)對MDCT系數(shù)序列的混沌特性進行檢測,一旦MDCT系數(shù)具有混沌特性后,則利用局部自適應(yīng)非線性預(yù)測結(jié)合低頻MDCT系數(shù)預(yù)測得到高頻MDCT系數(shù);而后再根據(jù)人耳的聽覺特性與高、低頻MDCT系數(shù)間的相關(guān)性,對高頻MDCT系數(shù)譜信息的諧波成分進行調(diào)整;最后;將原有 的低頻MDCT系數(shù)與重建所得高頻MDCT系數(shù)結(jié)合,利用逆MDCT變換將其變換到時域,得到經(jīng)過頻帶擴展后的全頻帶時域信號。 通過上述原理分析可以看出,該非線性預(yù)測法是一種利用音頻信號的非線性動力學(xué)特性及人耳的聽覺特性的盲目式頻帶擴展方法,更符合音頻變化的一般規(guī)律,一但找到了理想的相空間,則會產(chǎn)生高質(zhì)量的高頻信息。這是一項暫新的課題,有待進一步研究。 |
|