數(shù)字電視信源編碼的主要技術(shù)與標(biāo)準(zhǔn)
H.264 H.264/AVC 是ITU-T VCEG 和ISO/IEC MPEG共同開發(fā)的視頻處理標(biāo)準(zhǔn),ITU-T作為標(biāo)準(zhǔn)建議H.264,ISO/IEC作為國際標(biāo)準(zhǔn)14496-10(MPEG-4 第10部分)高級視頻編碼(AVC)。 MPEG-2視頻編碼標(biāo)準(zhǔn)(又稱為ITU-T H.262[2])已有10年的歷史了,由MPEG-1擴(kuò)充而來,支持隔行掃描。使用十分廣泛,幾乎用于所有的數(shù)字電視系統(tǒng),適合標(biāo)清和高清電視,適合各種媒體傳輸,包括衛(wèi)星、有線、地面等,都能有效地傳輸。然而,類似xDSL、UMTS(通用移動系統(tǒng))技術(shù)只能提供較小的傳輸速率,甚至DVB-T,也沒有足夠的頻段可用,提供的節(jié)目很有限,隨著高清電視的引入,迫切需要高壓縮比技術(shù)的出現(xiàn)。 應(yīng)用于電信的視頻編碼經(jīng)歷了ITUT H.261、H.262(MPEG-2)、H.263、H.263+、H.263++,提供的服務(wù)從ISDN和T1/E1到PSTN、移動無線網(wǎng)和LAN/INTERNET網(wǎng)。 最近MPEG-4第二部分進(jìn)入了實(shí)用領(lǐng)域,提供了視頻形狀編碼,目標(biāo)是與MPEG-2一樣獲得廣泛的數(shù)字電視應(yīng)用。 1998年,視頻編碼專家組(VCEG-ITU-T SG16Q.6)啟動了H.26L工程,旨在研制出新的壓縮標(biāo)準(zhǔn),與以前的任何標(biāo)準(zhǔn)相比,效率要提高一倍,同時具有簡單、直觀的視頻編碼技術(shù),網(wǎng)絡(luò)友好的視頻描述,適合交互和非交互式應(yīng)用(廣播、存儲、流煤體)。 2001年12月,VCEG和運(yùn)動圖像專家組(MPEG-ISO/IEC JTC 1/SC 29/WG 11)組成了聯(lián)合視頻組(JVT,Joint Video Team),研究新的編碼標(biāo)準(zhǔn)H.264/AVC,該標(biāo)準(zhǔn)于2003年3月正式獲得批準(zhǔn)。 視頻的各種應(yīng)用必須通過各種網(wǎng)絡(luò)傳送,這要求一個好的視頻方案能處理各種應(yīng)用和網(wǎng)絡(luò)接口。H.264/AVC為了解決這個問題,提供了很多靈活性和客戶化特性。H.264/AVC的設(shè)計方案包含兩個層次,視頻編碼層(VCL,Video Coding Layer)和網(wǎng)絡(luò)抽象層(NAL,Network Abstraction Layer)。視頻編碼層主要致力于有效地表示視頻內(nèi)容,網(wǎng)絡(luò)抽象層格式化VCL視頻表示,提供頭部信息,適合多種傳輸和存儲媒體。 VCL的設(shè)計同以前的ITU-T和 ISO/IEC JTC一樣,基于塊的混合視頻編碼方法。基本的源編碼算法是:利用時間統(tǒng)計的相關(guān)性,開發(fā)幀間預(yù)測算法;利用預(yù)測殘留變換編碼,開發(fā)空間統(tǒng)計的相關(guān)性。在提高編碼效率方面,沒有一個單一的算法做出特別的貢獻(xiàn),而是大量的小的改善算法綜合產(chǎn)生的結(jié)果。 一、主要特性 1、H.264/AVC相對以前的編碼方法,以MPEG-2為例,在圖像內(nèi)容預(yù)測方面提高編碼效率,改善圖像質(zhì)量的主要特點(diǎn)如下: ● 可變塊大小運(yùn)動補(bǔ)償: 選擇運(yùn)動補(bǔ)償大小和形狀比以前的標(biāo)準(zhǔn)更靈活,最小的亮度運(yùn)動補(bǔ)償塊可以小到4×4。 ●1/4采樣精度運(yùn)動補(bǔ)償:以前的標(biāo)準(zhǔn)最多1/2精度運(yùn)動補(bǔ)償,首次1/4采樣精度運(yùn)動補(bǔ)償出現(xiàn)在MPEG-4第二部分高級類部分,但H.264/AVC大大減少了內(nèi)插處理的復(fù)雜度。 ●運(yùn)動矢量可跨越圖像邊界:在以前的標(biāo)準(zhǔn)中,運(yùn)動矢量限制在已編碼參考圖像的內(nèi)部。圖像邊界外推法作為可選技術(shù)首次出現(xiàn)在H.263中。 ●多參考圖像運(yùn)動補(bǔ)償:在MPEG-2及以前的標(biāo)準(zhǔn)中,P幀只使用一幀,B幀只使用兩幀圖像進(jìn)行預(yù)測。H.264/AVC使用高級圖像選擇技術(shù),可以用以前已編碼過且保留在緩沖區(qū)的大量的圖像進(jìn)行預(yù)測,大大提高了編碼效率。 ●消除參考圖像順序和顯示圖像順序的相關(guān)性:在以前的標(biāo)準(zhǔn)中,參考圖像順序依賴顯示圖像順序,H.264/AVC消除了該限制,可以任意選擇。
● 消除參考圖像與圖像表示方法的限制:在以前的標(biāo)準(zhǔn)中,B幀圖像不能作為預(yù)測圖像,H.264/AVC在很多情況可以利用B幀圖像作為參考。 ● 加權(quán)預(yù)測:H.264/AVC采用新技術(shù),允許加權(quán)運(yùn)動補(bǔ)償預(yù)測和偏移一定量。在淡入淡出場景中該技術(shù)極大提高編碼效率,該技術(shù)還可用于其他多種用途。 ● 改善“跳過”和“直接”運(yùn)動推測:在以前的標(biāo)準(zhǔn)中,預(yù)測編碼圖像的“跳過”區(qū)不能有運(yùn)動。當(dāng)編碼有全局運(yùn)動的圖像時,該限制非常有害。H.264/AVC對“跳過”區(qū)的運(yùn)動采用推測方法。對雙預(yù)測的B幀圖像,采用高級運(yùn)動預(yù)測方法,稱為“直接”運(yùn)動補(bǔ)償,進(jìn)一步改善編碼效率。 ● 幀內(nèi)編碼直接空間預(yù)測:將編碼圖像邊沿進(jìn)行外推應(yīng)用到當(dāng)前幀內(nèi)編碼圖像的預(yù)測。 ● 循環(huán)去塊效應(yīng)濾波器:基于塊的視頻編碼在圖像中存在塊效應(yīng),主要來源于預(yù)測和殘余編碼。自適應(yīng)去塊效應(yīng)濾波技術(shù)是非常著名的技術(shù),能有效消除塊效應(yīng),改善視頻的主觀和客觀質(zhì)量。
2、除改善預(yù)測方法外,其他改善編碼效率的特性如下: ● 小塊變換:以前的標(biāo)準(zhǔn)變換的塊都是8×8,H.264/AVC主要使用4×4塊變換,使編碼器表示信號局部適應(yīng)性更好,更適合預(yù)測編碼,減少“鈴”效應(yīng)。另外圖像邊界需要小塊變換。 ● 分級塊變換:H.264/AVC通常使用小塊變換,但有些信號包含足夠的相關(guān)性,要求以大塊表示,H.264/AVC有兩種方式實(shí)現(xiàn)。低頻色度信號可用8×8,;對幀內(nèi)編碼,可使用特別的編碼類型,低頻亮度信號可用16×16塊。 ● 短字長變換: 所有以前標(biāo)準(zhǔn)使用的變換要求32位運(yùn)算,H.264/AVC只使用16位運(yùn)算。 ● 完全匹配反變換:所有以前標(biāo)準(zhǔn)反變換和變換之間存在一定容限的誤差,因此,每個解碼器輸出視頻信號都不相同,產(chǎn)生小的漂移,最終影響圖像的質(zhì)量,H.264/AVC實(shí)現(xiàn)了完全匹配。 ● 基于上下文的熵編碼:H.264/AVC使用兩種熵編碼方法,CAVLC(上下文自適應(yīng)的可變長編碼)和CABAC(上下文自適應(yīng)二進(jìn)制算術(shù)編碼),兩種都是基于上下文的熵編碼技術(shù)。
3、H.264/AVC具有強(qiáng)大的糾錯功能和各種網(wǎng)絡(luò)環(huán)境操作靈活性,主要特性如下: ● 參數(shù)集結(jié)構(gòu):H.264/AVC參數(shù)集結(jié)構(gòu)設(shè)計了強(qiáng)大、有效的傳輸頭部信息。在以前的標(biāo)準(zhǔn)中,如果少數(shù)幾位關(guān)鍵信息丟失,可能解碼器產(chǎn)生嚴(yán)重解碼錯誤。H.264/AVC采用很靈活、特殊的方式,分開處理關(guān)鍵信息,能在各種環(huán)境下可靠傳送。 ● NAL單元語法結(jié)構(gòu):H.264/AVC中的每一個語法結(jié)構(gòu)放置在稱為NAL的單元中,以前的標(biāo)準(zhǔn)采用強(qiáng)制性特定的位流接口。NAL單元語法結(jié)構(gòu)允許很自由的客戶化,幾乎適合所有的網(wǎng)絡(luò)接口。 ● 靈活的像條大小:在MPEG-2中,規(guī)定了嚴(yán)格的像條結(jié)構(gòu),頭部數(shù)據(jù)量大,降低預(yù)測效率,編碼效率低。在H.264/AVC可采用非常靈活的像條大小。 ● 靈活宏塊排序(FMO):H.264/AVC可以將圖像劃分為像條組,又稱為圖像區(qū),每個像條可以獨(dú)立解碼。FMO通過管理圖像區(qū)之間的關(guān)系,具有很強(qiáng)的抗數(shù)據(jù)丟失能力。 ● 任意像條排序:因?yàn)槊總€像條幾乎可以獨(dú)立解碼,所以像條可以按任意順序發(fā)送和接收,在實(shí)時應(yīng)用中,可以改善端到端的延時特性,特別適合于接收順序和發(fā)送順序不能對應(yīng)的網(wǎng)絡(luò)中,如使用INTERNET網(wǎng)絡(luò)協(xié)議的應(yīng)用。 ● 冗余圖像:為提高抗數(shù)據(jù)丟失的能力,H.264/AVC設(shè)計中包含一種新的能力,允許編碼器發(fā)送圖像區(qū)的冗余表示,當(dāng)圖像區(qū)的主表示丟失時仍可以正確解碼。 ● 數(shù)據(jù)劃分:視頻流中的編碼信息的重要性不同,有些信息(如運(yùn)動矢量、預(yù)測信息等)比其他信息更為重要。H.264/AVC可以根據(jù)每個像條語法元素的范疇,將像條語法劃分為3部分,分開傳送。
二、網(wǎng)絡(luò)層 NAL規(guī)范視頻數(shù)據(jù)的格式,主要是提供頭部信息,以適合各種媒體的傳輸和存儲。NAL支持各種網(wǎng)絡(luò),包括: ● 任何使用RTP/IP協(xié)議的實(shí)時有線和無線Internet 服務(wù)。 ● 作為MP4文件存儲和多媒體信息文件服務(wù)。 ● MPEG-2系統(tǒng)。 ● 其他網(wǎng)。 1、NAL 單元 編碼的視頻流組織成NAL單元,視頻數(shù)據(jù)放置在網(wǎng)絡(luò)單元中傳輸,每個網(wǎng)絡(luò)單元包含整數(shù)個字節(jié),第一個字節(jié)是頭部信息,指示NAL單元的數(shù)據(jù)類型,其余是凈荷。 凈荷數(shù)據(jù)與仿真預(yù)防字節(jié)做交織處理,仿真預(yù)防字節(jié)是特殊值字節(jié),防止偶然在凈荷中出現(xiàn)同步字節(jié)圖樣。 NAL規(guī)定一種通用的格式,既適合面向包傳輸,也適合流傳送。實(shí)際上,包傳輸和流傳輸?shù)姆绞绞窍嗤?,不同之處是流傳輸前面增加了一個起始碼前綴。
2、NAL單元在字節(jié)流中的應(yīng)用 類似H.320和MPEG-2/H.222.0等傳輸系統(tǒng),傳輸NAL作為有序連續(xù)字節(jié)或比特流,同時要依靠數(shù)據(jù)本身識別NAL單元邊界。在這樣的應(yīng)用系統(tǒng)中,H.264/AVC規(guī)范定義了字節(jié)流格式,每個NAL單元前面增加3個字節(jié)的前綴,即同步字節(jié)。在比特流應(yīng)用中,每個圖像需要增加一個附加字節(jié)作為邊界定位。還有一種可選特性,在字節(jié)流中增加附加數(shù)據(jù),用做擴(kuò)充發(fā)送數(shù)據(jù)量,能實(shí)現(xiàn)快速邊界定位,恢復(fù)同步。
3、NAL單元在面向包傳送中的應(yīng)用 在類似Internet/RTP面向包傳送協(xié)議系統(tǒng)中,包結(jié)構(gòu)中包含包邊界識別字節(jié),在這種情況下,不需要同步字節(jié)。
4、VCL和非VCL的NAL單元 NAL單元分為VCL和非VCL兩種,VCL NAL單元包含視頻圖像采樣信息,非VCL包含各種有關(guān)的附加信息,例如參數(shù)集(頭部信息,應(yīng)用到大量的VCL NAL單元)、提高性能的附加信息、定時信息等。
5、參數(shù)集 參數(shù)集是很少變化的信息,用于大量VCL NAL單元的解碼,分為兩種類型: ● 序列參數(shù)集,作用于一串連續(xù)的視頻圖像,即視頻序列。 ● 圖像參數(shù)集,作用于視頻序列中的一個或多個個別的圖像。 序列和圖像參數(shù)集機(jī)制,減少了重復(fù)參數(shù)的傳送,每個VCL NAL單元包含一個標(biāo)識,指向有關(guān)的圖像參數(shù)集,每個圖像參數(shù)集包含一個標(biāo)識,指向有關(guān)的序列參數(shù)集的內(nèi)容,因此,只用少數(shù)的指針信息,引用大量的參數(shù),大大減少每個VCL NAL單元重復(fù)傳送的信息。 序列和圖像參數(shù)集可以在發(fā)送VCL NAL單元以前發(fā)送,并且重復(fù)傳送,大大提高糾錯能力。序列和圖像參數(shù)集可以在“帶內(nèi)”,也可以用更為可靠的其他“帶外”通道傳送。
6、存儲單元 一組指定格式的NAL單元稱為存儲單元,每個存儲單元對應(yīng)一個圖像。每個存儲單元包含一組VCL NAL單元,組成一個主編碼圖像,VCL NAL單元由表示視頻圖像采樣的像條所組成。存儲單元前面可以加一個前綴,分界存儲單元,附加增強(qiáng)信息(SEI)(如圖像定時信息)也可以放在主編碼圖像的前面。 主編碼圖像后附加的VCL NAL單元,包含同一圖像的冗余表示,稱為冗余編碼圖像,當(dāng)主編碼圖像數(shù)據(jù)丟失或損壞時,可用冗余編碼圖像解碼。
7、編碼視頻序列 一個編碼視頻序列由一串連續(xù)的存儲單元組成,使用同一序列參數(shù)集。每個視頻序列可獨(dú)立解碼。編碼序列的開始是即時刷新存儲單元(IDR)。IDR是一個I幀圖像,表示后面的圖像不用參考以前的圖像。一個NAL單元流可包含一個或更多的編碼視頻序列。 MPEG-4標(biāo)準(zhǔn) 運(yùn)動圖像專家組MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)標(biāo)準(zhǔn)第一版本。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成為國際標(biāo)準(zhǔn)。 |
|