H.264 視頻 RTP 負(fù)載格式
1. 網(wǎng)絡(luò)抽象層單元類型 (NALU)
NALU 頭由一個(gè)字節(jié)組成, 它的語法如下:
+---------------+ |0|1|2|3|4|5|6|7| +-+-+-+-+-+-+-+-+ |F|NRI| Type | +---------------+
F: 1 個(gè)比特. forbidden_zero_bit. 在 H.264 規(guī)范中規(guī)定了這一位必須為 0.
NRI: 2 個(gè)比特. nal_ref_idc. 取 00 ~ 11, 似乎指示這個(gè) NALU 的重要性, 如 00 的 NALU 解碼器可以丟棄它而不影響圖像的回放. 不過一般情況下不太關(guān)心
這個(gè)屬性.
Type: 5 個(gè)比特. nal_unit_type. 這個(gè) NALU 單元的類型. 簡述如下:
0 沒有定義 1-23 NAL單元 單個(gè) NAL 單元包. 24 STAP-A 單一時(shí)間的組合包 24 STAP-B 單一時(shí)間的組合包 26 MTAP16 多個(gè)時(shí)間的組合包 27 MTAP24 多個(gè)時(shí)間的組合包 28 FU-A 分片的單元 29 FU-B 分片的單元 30-31 沒有定義
2. 打包模式
下面是 RFC 3550 中規(guī)定的 RTP 頭的結(jié)構(gòu).
0 1 2 3 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |V=2|P|X| CC |M| PT | sequence number | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | timestamp | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | synchronization source (SSRC) identifier | +=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+ | contributing source (CSRC) identifiers | | .... | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
負(fù)載類型 Payload type (PT): 7 bits 序列號 Sequence number (SN): 16 bits 時(shí)間戳 Timestamp: 32 bits H.264 Payload 格式定義了三種不同的基本的負(fù)載(Payload)結(jié)構(gòu). 接收端可能通過 RTP Payload 的第一個(gè)字節(jié)來識別它們. 這一個(gè)字節(jié)類似 NALU 頭的格式, 而這個(gè)頭結(jié)構(gòu)的 NAL 單元類型字段 則指出了代表的是哪一種結(jié)構(gòu),
這個(gè)字節(jié)的結(jié)構(gòu)如下, 可以看出它和 H.264 的 NALU 頭結(jié)構(gòu)是一樣的. +---------------+ |0|1|2|3|4|5|6|7| +-+-+-+-+-+-+-+-+ |F|NRI| Type | +---------------+ 字段 Type: 這個(gè) RTP payload 中 NAL 單元的類型. 這個(gè)字段和 H.264 中類型字段的區(qū)別是, 當(dāng) type 的值為 24 ~ 31 表示這是一個(gè)特別格式的 NAL 單元, 而 H.264 中, 只取 1~23 是有效的值. 24 STAP-A 單一時(shí)間的組合包 24 STAP-B 單一時(shí)間的組合包 26 MTAP16 多個(gè)時(shí)間的組合包 27 MTAP24 多個(gè)時(shí)間的組合包 28 FU-A 分片的單元 29 FU-B 分片的單元 30-31 沒有定義
可能的結(jié)構(gòu)類型分別有:
1. 單一 NAL 單元模式 即一個(gè) RTP 包僅由一個(gè)完整的 NALU 組成. 這種情況下 RTP NAL 頭類型字段和原始的 H.264的 NALU 頭類型字段是一樣的.
2. 組合封包模式 即可能是由多個(gè) NAL 單元組成一個(gè) RTP 包. 分別有4種組合方式: STAP-A, STAP-B, MTAP16, MTAP24. 那么這里的類型值分別是 24, 25, 26 以及 27.
3. 分片封包模式 用于把一個(gè) NALU 單元封裝成多個(gè) RTP 包. 存在兩種類型 FU-A 和 FU-B. 類型值分別是 28 和 29.
2.1 單一 NAL 單元模式
對于 NALU 的長度小于 MTU 大小的包, 一般采用單一 NAL 單元模式. 對于一個(gè)原始的 H.264 NALU 單元常由 [Start Code] [NALU Header] [NALU Payload] 三部分組成, 其中 Start Code 用于標(biāo)示這是一個(gè)
NALU 單元的開始, 必須是 "00 00 00 01" 或 "00 00 01", NALU 頭僅一個(gè)字節(jié), 其后都是 NALU 單元內(nèi)容. 打包時(shí)去除 "00 00 01" 或 "00 00 00 01" 的開始碼, 把其他數(shù)據(jù)封包的 RTP 包即可.
0 1 2 3 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |F|NRI| type | | +-+-+-+-+-+-+-+-+ | | | | Bytes 2..n of a Single NAL unit | | | | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | :...OPTIONAL RTP padding | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
如有一個(gè) H.264 的 NALU 是這樣的:
[00 00 00 01 67 42 A0 1E 23 56 0E 2F ... ]
這是一個(gè)序列參數(shù)集 NAL 單元. [00 00 00 01] 是四個(gè)字節(jié)的開始碼, 67 是 NALU 頭, 42 開始的數(shù)據(jù)是 NALU 內(nèi)容.
封裝成 RTP 包將如下:
[ RTP Header ] [ 67 42 A0 1E 23 56 0E 2F ]
即只要去掉 4 個(gè)字節(jié)的開始碼就可以了.
2.2 組合封包模式
其次, 當(dāng) NALU 的長度特別小時(shí), 可以把幾個(gè) NALU 單元封在一個(gè) RTP 包中.
0 1 2 3 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | RTP Header | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |STAP-A NAL HDR | NALU 1 Size | NALU 1 HDR | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | NALU 1 Data | : : + +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | | NALU 2 Size | NALU 2 HDR | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | NALU 2 Data | : : | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | :...OPTIONAL RTP padding | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
2.3 Fragmentation Units (FUs).
而當(dāng) NALU 的長度超過 MTU 時(shí), 就必須對 NALU 單元進(jìn)行分片封包. 也稱為 Fragmentation Units (FUs). 0 1 2 3 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | FU indicator | FU header | | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | | | | FU payload | | | | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | :...OPTIONAL RTP padding | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Figure 14. RTP payload format for FU-A
The FU indicator octet has the following format:
+---------------+ |0|1|2|3|4|5|6|7| +-+-+-+-+-+-+-+-+ |F|NRI| Type | +---------------+
The FU header has the following format:
+---------------+ |0|1|2|3|4|5|6|7| +-+-+-+-+-+-+-+-+ |S|E|R| Type | +---------------+
3. SDP 參數(shù)
下面描述了如何在 SDP 中表示一個(gè) H.264 流:
. "m=" 行中的媒體名必須是 "video" . "a=rtpmap" 行中的編碼名稱必須是 "H264". . "a=rtpmap" 行中的時(shí)鐘頻率必須是 90000. . 其他參數(shù)都包括在 "a=fmtp" 行中.
如:
m=video 49170 RTP/AVP 98 a=rtpmap:98 H264/90000 a=fmtp:98 profile-level-id=42A01E; sprop-parameter-sets=Z0IACpZTBYmI,aMljiA==
下面介紹一些常用的參數(shù).
3.1 packetization-mode: 表示支持的封包模式. 當(dāng) packetization-mode 的值為 0 時(shí)或不存在時(shí), 必須使用單一 NALU 單元模式. 當(dāng) packetization-mode 的值為 1 時(shí)必須使用非交錯(cuò)(non-interleaved)封包模式. 當(dāng) packetization-mode 的值為 2 時(shí)必須使用交錯(cuò)(interleaved)封包模式. 這個(gè)參數(shù)不可以取其他的值.
3.2 sprop-parameter-sets: 這個(gè)參數(shù)可以用于傳輸 H.264 的序列參數(shù)集和圖像參數(shù) NAL 單元. 這個(gè)參數(shù)的值采用 Base64 進(jìn)行編碼. 不同的參數(shù)集間用","號隔開. 3.3 profile-level-id: 這個(gè)參數(shù)用于指示 H.264 流的 profile 類型和級別. 由 Base16(十六進(jìn)制) 表示的 3 個(gè)字節(jié). 第一個(gè)字節(jié)表示 H.264 的 Profile 類型, 第
三個(gè)字節(jié)表示 H.264 的 Profile 級別: 3.4 max-mbps: 這個(gè)參數(shù)的值是一個(gè)整型, 指出了每一秒最大的宏塊處理速度.
|