日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

信息的編碼

 百眼通 2014-09-29

*進位計數(shù)制的基本概念

   將數(shù)字符號按序排列成數(shù)位,并遵照某種由低位到高位的進位 方式計數(shù)表示數(shù)值的方法,稱作進位計數(shù)制。

1. 十進制
  十進制計數(shù)制由 0、 1、 2、 3、 4、 5、 6、 7、 8、 9共 10個數(shù)字符號組成。相同數(shù)字符號在不同的數(shù)位上表示不同的數(shù)值,每個數(shù)位計滿十就向高位進一,即 “逢十進一 ”。
  如: 555.5可以表示成
  555.5= 5×100+5×10+5×1+5×( 1/10)

  一個任意的十進制數(shù)都可以表示成:
  

2. 八進制
  八進制計數(shù)制由 0、 1、 2、 3、 4、 5、 6、 7共 8個數(shù)字符號組成。相同數(shù)字符號在不同的數(shù)位上表示不同的數(shù)值,每個數(shù)位計滿八就向高位進一,即 “逢八進一 ”。
  如:( 555.5) 8 可以表示成
  ( 555.5) 8 = 5×16+5×8+5×1+5×( 1/8)

  一個任意的十進制數(shù)都可以表示成:
  

3. 二進制
  二進制計數(shù)制由 0和 1共 2個數(shù)字符號組成。相同數(shù)字符號在不同的數(shù)位上表示不同的數(shù)值,每個數(shù)位計滿二就向高位進一,即 “逢二進一 ”。
  如:( 1011.1) 2 = 1×8+0×4+1×2+1×1+1×( 1/2)

  一個任意的二進制數(shù)都可以表示成:
  

4. 其他進制
  在日常生活和日常工作中還會使用其他進制數(shù)。如:十二進制數(shù)、十六進制數(shù)、百進制數(shù)和千進制數(shù)等。無論哪種進制數(shù),表示的方法都是類似的。如:十六進制數(shù)由 0、 1、 2、 3、 4、 5、 6、 7、 8、 9、 A、 B、 C、 D、 E和 F共十六個符號組成, “逢十六進一 ”。不同的是用 A、 B、 C、 D、 E和 F分別表示 10、 11、 12、 13、 14和 15六個數(shù)字符號。

5. 基數(shù)與權
  某進制計數(shù)制允許選用的基本數(shù)字符號的個數(shù)稱為基數(shù)。一般而言, J進制數(shù)的基數(shù)為 J,可供選用的基本數(shù)字符號有 J個,分別為 0到 J- 1,每個數(shù)位計滿 J就向高位進一,即 “逢 J進一 ”。
  某進制計數(shù)制中各位數(shù)字符號所表示的數(shù)值表示該數(shù)字符號值乘以一個與數(shù)字符號有關的常數(shù),該常數(shù)稱為 “位權 ”(簡稱 “權 ”)。位權的大小是以基數(shù)為底,數(shù)字符號所處的位置的序號為指數(shù)的整數(shù)次冪。
  十進制數(shù)允許使用十個基本數(shù)字符號,所以基數(shù)為 10,每位數(shù)字符號代表的位數(shù)的大小是以 10為底,數(shù)字符號所處位置的序號為指數(shù)的整數(shù)次冪。


(如圖所示)給出了任意進制數(shù)( K 2 K 1 K 0 K -1 K -2 ) ,當 J分別為: 2, 8, 10和 16時各位權值對照。

*數(shù)制之間的轉換:

計算機內(nèi)部使用的數(shù)字符號只有 “0” 和 “1” 兩個。也就是說計算機內(nèi)部使用的是二進制數(shù)所有的數(shù)值數(shù)據(jù)和非數(shù)值數(shù)據(jù),都是由 “0” 和 “1” 這兩個數(shù)字符號加以組合而成的,我們稱之為 “ 二進制代碼 ” 。

1 .為什么要采用二進制
盡管二進制數(shù)不符合人們的習慣。但是計算機內(nèi)部仍采用二進制表示信息,主要原因有以下幾點:

1 ) 容易實現(xiàn)
   計算機是由邏輯電路組成,邏輯電路通常只有兩種狀態(tài)。例如:開關的接通與斷開,電壓電平的高與低等。這兩種狀態(tài)正好用來表示二進制數(shù)的兩個數(shù)碼 0 和 1 。

2 ) 工作可靠
   兩個狀態(tài)代表的兩個數(shù)碼在數(shù)字傳輸和處理中不容易出錯,因而電路更加穩(wěn)定可靠。

3 ) 簡化運算
   二進制運算法則簡單。兩個一位二進制數(shù)的求和、求積運算組合僅有三種,即 0 + 0 = 0 , 0 + 1 = 1 , 1 + 0 = 1 , 1 + 1 = 0 (向高位進一)及 0*0 = 0 , 0*1 = 1 , 1*0 = 0 , 1*1 = 1 。而求兩個一位十進制的和與積的運算組合則各有 55 種之多,讓計算機去實現(xiàn)就困難的多。

4 ) 邏輯性強
   計算機的工作是建立在邏輯運算基礎上的,邏輯代數(shù)是邏輯運算的理論依據(jù)。二進制只有兩個數(shù)碼,正好代表邏輯代數(shù)中的 “ 真 ” 與 “ 假 ” 。

5 ) 易于轉換
   二進制數(shù)與十進制數(shù)之間可以互相轉換。這樣,既有利于充分發(fā)揮計算機的特點,又不影響人們使用十進制數(shù)的習慣。

2 .數(shù)值間的轉換
   計算機只用二進制的兩個數(shù)碼 “0” 和 “1” 來實現(xiàn)算術和邏輯運算,而人們?nèi)匀挥檬M制的形式向計算機中輸入原始數(shù)據(jù),并讓計算機也用十進制形式顯示和打印運算結果。所以必須有一種自動轉換方法,即讓數(shù)據(jù)輸入計算機后,將十進制轉換成對應的二進制數(shù),并在處理完畢后,再自動將二進制結果轉換為十進制數(shù)。
   為了表達方便起見,常在數(shù)字后加一縮寫字母后綴作為不同進制數(shù)的標識。各種進制數(shù)的后綴字母分別為:
  B :二進制數(shù)。
  Q :八進制數(shù)。
  D :十進制數(shù)。
  H :十六進制數(shù)。
   對于十進制數(shù)通常不加后綴,也即十進制數(shù)后的字母 D 可省略。


( 1 )將二進制數(shù)轉換成對應的十進制數(shù)
   將二進制數(shù)轉換成對應的十進制數(shù)的方法是“按權展開求和”:
   利用二進制數(shù)按權展開的多項式之和的表達式,取基數(shù)為 2 ,逐項相加,其和就是對應的十進制數(shù)。
   例 1 :將二進制數(shù) 1011.1 轉換成對應的十進制
   解: 1011.1B=1×2 3+0×2 2+1×2 1+1×2 0+1×2 -1
  =8+0+2+1+0.5
  =11.5D
  例2:
   

( 2 )將十進制數(shù)轉換成對應的二進制數(shù)
   將十進制數(shù)轉換為對應的二進制數(shù)的方法是:
   對于整數(shù)部分,用被除數(shù)反復除以 2 ,除第一次外,每次除以 2 均取前一次商的整數(shù)部分作被除數(shù)并依次記下每次的余數(shù)。另外,所得到的商的最后一位余數(shù)是所求二進制數(shù)的最高位。
   對于小數(shù)部分,采用連續(xù)乘以基數(shù) 2 ,并依次取出的整數(shù)部分,直至結果的小數(shù)部分為 0 為止。故該法稱 “ 乘基取整法 ” 。

例:將十進制 117.625D 轉換成二進制數(shù)
解:整數(shù)部分: “除以 2 取余,逆序輸出
    

小數(shù)部分 : “乘以 2 取整,順序輸出”
    
所以 117.625D = 1110101.101B

例2:

例3:

特別提示:將十進制數(shù)轉換成其他進制數(shù)方法與次上述方法類似。

( 3 )將二進制數(shù)轉換為對應的八進制數(shù)
   由于 1 位八進制數(shù)對應 3 位二進制數(shù),所以二進制數(shù)轉換成八進制數(shù)時,只要以小數(shù)點為界,整數(shù)部分向左,小數(shù)部分向右每 3 位分成一組,各組用對應的 1 位八進制數(shù)字表示,即可得到對應的八進制數(shù)值。最左最右端分組不足 3 位時,可用 0 補足。

例:將 1101101.10101B 轉換成對應的八進制數(shù)。
解:
  
   所以, 1101101.10101B = 155.52Q 。

   同理,用相反的方法可以將八進制數(shù)轉換成對應的二進制數(shù)。



( 4 )將二進制數(shù)轉為對應的十六進制數(shù)
   由于 1 位十六進制數(shù)對應 4 位二進制數(shù),所以二進制數(shù)轉換為十六進制時,只要以小數(shù)點為界,整數(shù)部分向左,小數(shù)部分向右每 4 位分成一組,各組用對應的 1 位十六進制數(shù)字表示,即可得到對應的十六進制數(shù)值。兩端的分組不足 4 位時,用 0 補足。

例:將 1101101.10101B 轉換成對應的十六進制數(shù)
解:
  
   所以 1101101.10101B = 6D.8AH 。

   同理,用相反的方法可以將十六進制數(shù)轉換成對應的二進制數(shù)。

例:將十六進制數(shù) 5DF.9 轉換成二進制:

例:將二進制數(shù) 1100001.111 轉換成十六進制:

   至于其他的轉換方法,如八進制到十進制,十六進制到十進制之間的轉換,同樣可用按權展開的多項式之和及整數(shù)部分用 “ 除基取整數(shù) ” 來實現(xiàn)的。只不過此時基數(shù)分別為 8 和 16 。當然,更簡單實用的方法是借用二進制數(shù)做橋梁,用 “ 八 —— 二 —— 十 ” 或 “ 十六 —— 二 —— 八 ” 的轉換方法來實現(xiàn)。

*數(shù)據(jù)的編碼表示

1 .基本概念
( 1)編碼
   計算機要處理的數(shù)據(jù)除了數(shù)值數(shù)據(jù)以外,還有各類符號、圖形、圖像和聲音等非數(shù)值數(shù)據(jù)。而計算機只能識別兩個數(shù)字。要使計算機能處理這些信息,首先必須將各類信息轉換成 “ 0”和 “ 1”表示的代碼,這一過程成為編碼。
( 2)數(shù)據(jù)
   能被計算機接受和處理的符號的集合都稱為數(shù)據(jù)。
   數(shù)據(jù)和信息是一對比較容易混淆的術語。
   數(shù)據(jù)是計算機處理的對象,是信息的載體,或稱編碼了的信息;
   信息是數(shù)據(jù)經(jīng)過加工處理以后的結果,是有意義的數(shù)據(jù)的內(nèi)容。
( 3)比特
   比特( Bit: Binary Digit ——二進制數(shù)位)是指 1位二進制的數(shù)碼(即 0或 1)。比特是計算機中表示信息的數(shù)據(jù)編碼中的最小單位。
( 4)字節(jié)
   字節(jié)表示被處理的一組連續(xù)的二進制數(shù)字。通常用 8位二進制數(shù)字表示一個字節(jié),即一個字節(jié)由 8個比特組成。
   字節(jié)是存儲器系統(tǒng)的最小存取單位。

2 .數(shù)值數(shù)據(jù)的表示
   數(shù)值數(shù)據(jù)有大小和正負之分。
  通常在微型計算機中,用兩個字節(jié)表示一個整數(shù),用四個字節(jié)表示一個實數(shù)。在二進制數(shù)的最前面規(guī)定一個符號位: “ 0”表示正數(shù), “ 1”表示負數(shù)。
  數(shù)據(jù)表示方法通常有定點數(shù)表示和浮點數(shù)表示兩種。

( 1)定點數(shù)的表示
① 定點整數(shù):小數(shù)點的位置在最低數(shù)值位的后面,用于表示整數(shù) (如圖 1所示)

數(shù)符

數(shù)值

(圖 1)

② 定點小數(shù):小數(shù)點的位置約定在最高數(shù)值位的前面,用于表示小于 1的純小數(shù) (如圖 2所示)。


(圖 2)

( 2)浮點數(shù)的表示
   浮點數(shù)的表示來源于數(shù)學中的指數(shù)形式:
  N= M×Rc
  式中 R表示進制數(shù)的基數(shù)。 N可以用下面兩個部分表示。

①尾數(shù) M。尾數(shù)為小于 1的小數(shù)。尾數(shù)的長度影響數(shù)據(jù)的精度。
②階碼 c。階碼相當于數(shù)學中的指數(shù)。階碼的大小影響浮點數(shù)可以表示的數(shù)據(jù)的大小范圍。
( 如圖 3所示)給出了浮點數(shù)的表示方法。

階符

階碼

尾符

尾數(shù)

( 圖 3)


3 .字符的表示
   字符是人與計算機交互過程中不可缺少的重要信息。要使計算機能處理、存儲字符信息,首先也必須用二進制 “ 0”和 “ 1”代碼對字符進行編碼。
  下面以西文字符和漢字字符為例,介紹常用的編碼標準。

( 1) ASCII編碼
  ASCII 編碼是由美國國家標準委員會制定的一種包括數(shù)字、字母、通用符號和控制符號在內(nèi)的字符編碼集,全稱叫美國國家信息交換標準代碼( American Standard Code for Information Interchange)。 ASCII碼是一種 7位二進制編碼,能表示 2 7= 128種國際上最通用的西文字符,是目前計算機中,特別是微型計算機中使用最普遍的字符編碼集。詳見表 1.2。

  ASCII編碼包括 4類最常用的字符。
①數(shù)字 “ 0”~ “ 9”。 ASCII編碼的值分別為 0110000B~ 0111001B,對應十六進制數(shù)為 30H~ 39H。
②26個英文字母。大寫字母 “A”~ “Z”的 ASCII編碼值為 41H~ 5AH,小寫字母 “a”~ “z”的 ASCII編碼值為 61H~ 7AH。
③用字符。如 “+ ”、 “- ”、 “= ”、 “*”和 “/”等共 32個。
④制符號。如空格符和車符等共 34個。

  ASCII碼是一種 7位編碼,它存時必須占全一個字節(jié),也即占用 8位: b 7b 6b 5b 4b 3b 2b 1b 0,其中 b 7恒為 0,其余幾位為 ASCII碼值。

( 2)漢字編碼
   國家標準漢字編碼集( GB2312-80)共收集和定義了 7445個基本漢字。其中,使用頻度較高的 3755個漢字定義為一級漢字。使用頻率較低的 3008個漢字定義為二級漢字,共有 6763個漢字。另外還定義了拉丁字母、俄文字母、漢語拼音字母、數(shù)字和常用符號等 682個。
  GB2312- 80規(guī)定每個漢字用 2個字節(jié)的二進制編碼,每個字節(jié)最高位為 0,其余 7位用于表示漢字信息。
  例如,漢字 “啊 ”的國標碼的 2個字節(jié)的二進制編碼 00110000B和 00100001B,對應的十六進制數(shù)為 30H和 21H。
  另外,計算機內(nèi)部使用的漢字機內(nèi)碼的標準方案是將漢字國標碼的 2個字節(jié)二進制代碼的最高位置為 1,從而得到對應的漢字機內(nèi)碼
  如漢字 “啊 ”的機內(nèi)碼為 10110000B、 10100001B(即 B0H、 A1H)。
  計算機處理字符數(shù)據(jù)時,當遇到最高位為 1的字節(jié),便可將該字節(jié)連同其后續(xù)最高位也為 1的另一個字節(jié)看作 1個漢字機內(nèi)碼;當遇到最高位為 0的字節(jié),則可看作一個 ASCII碼西文字符,這樣就實現(xiàn)了漢字、西文字符的共存與區(qū)分。
   2000 年3 月17 日 ,國家信息產(chǎn)業(yè)部和國家質量技術監(jiān)督局聯(lián)合頒布了GB18030- 2000《信息技術 信息交換用漢字編碼字符集基本集的擴充》。在新標準中采用了單、雙、四字節(jié)混合編碼,收錄了 27000多個漢字和藏、蒙、維吾爾等主要的少數(shù)民族文字,總的編輯空間超過了 150萬個碼位。新標準適用于圖形字符信息的處理、交換、存儲、傳輸、顯示、輸入和輸出,并直接與 GB2312- 80信息處理交換碼所對應的事實上的內(nèi)碼標準相兼容。所以,新標準與現(xiàn)有的絕大多數(shù)操作系統(tǒng)、中文平臺兼容,能支持現(xiàn)有的各種應用系統(tǒng)。

 *漢字交換碼
  
漢字交換碼是指不同的具有漢字處理功能的計算機系統(tǒng)之間在交換漢字信息時所使用的代碼標準。自國家標準 GB2312 - 80 公布以來,我國一直延用該標準所規(guī)定的國標碼作為統(tǒng)一的漢字信息交換碼。

GB2312 - 80 標準包括了 6763 個漢字 ,按其使用頻度分為一級漢字 3755 個和二級漢字 3008 個。一級漢字按拼音排序,二級漢字按部首排序。此外,該標準還包括標點符號、數(shù)種西文字母、圖形、數(shù)碼等符號 682 個。

區(qū)位碼的區(qū)碼和位碼均采用從 01 到 94 的十進制,國標碼采用十六進制的 21H 到 73H (數(shù)字后加 H 表示其為十六進制數(shù))。區(qū)位碼和國標碼的換算關系是:區(qū)碼和位碼分別加上十進制數(shù) 32 。如“國”字在表中的 25 行 90 列,其區(qū)位碼為 2590 ,國標碼是 397AH 。

* 由于 GB2312 - 80 是 80 年代制定的標準,在實際應用時常常感到不夠,所以,建議處理文字信息的產(chǎn)品采用新頒布的 GB18030 信息交換用漢字編碼字符集,這個標準繁、簡字均處同一平臺,可解決兩岸三地間 GB 碼與 BIG 5 碼 間的字碼轉換不便的問題。

 *漢字輸入碼
  漢字輸入方法很多,如區(qū)位、拼音、五筆字型等。不同輸入法有自己的編碼方案,所采用的編碼方案統(tǒng)稱為輸入碼。輸入碼進入機器后必須轉換為機內(nèi)碼進行存儲和處理。
  漢字輸入方法大體可分為:區(qū)位碼(數(shù)字碼)、音碼、形碼、音形碼。

  • 區(qū)位碼:優(yōu)點是無重碼或重碼率低,缺點是難于記憶;
  • 音碼:優(yōu)點是大多數(shù)人都易于掌握,但同音字多,重碼率高,影響輸入的速度;
  • 形碼:根據(jù)漢字的字型進行編碼,編碼的規(guī)則較多,難于記憶,必須經(jīng)過訓練才能較好地掌握;重碼率低
  • 音形碼:將音碼和形碼結合起來,輸入漢字,減少重碼率,提高漢字輸入速度;

  如,以全拼輸入方案鍵入 “neng”,或以五筆字型輸入方案 “ce”,都能得到 “能 ”這個漢字所對應的機內(nèi)碼。這個工作由漢字代碼轉換程序依靠事先編制好的輸入碼對照表完成轉換。

 *漢字字形碼 (字形存儲碼)
   字形存儲碼是指供計算機輸出漢字(顯示或打?。┯玫亩M制信息,也稱字模。通常,采用的是數(shù)字化點陣字模。

 漢字字形碼是一種用點陣表示字形的碼,是漢字的輸出形式。它把漢字排成點陣。常用的點陣由 16×16、 24×24、 32×32或更高。每一個點在存儲器中用一個二進制位( bit )存儲。例如,在 16 × 16 的點陣中,需 8 × 32 bit 的存儲空間,每 8 bit 為 1 字節(jié),所以,需 32 字節(jié)的存儲空間; 24×24點陣要占 72個字節(jié)(為什么?)。在相同點陣中,不管其筆劃繁簡,每個漢字所占的字節(jié)數(shù)相等。

 為了節(jié)省存儲空間,普遍采用了字形數(shù)據(jù)壓縮技術。所謂的矢量漢字是指用矢量方法將漢字點陣字模進行壓縮后得到的漢字字形的數(shù)字化信息。
  所有不同的漢字字體的字形構成漢字庫,一般存儲在硬盤上,當要顯示輸出時,才調(diào)入內(nèi)存,檢索到要輸出的字形送到顯示器輸出。

( 3)其他信息的編碼

 *圖像的表示
   一幅圖像可認為是由一個個像點構成的,這些像點稱為像素。每個像素必須用若干二進制位進行編碼,才能表示出現(xiàn)實世界中的五彩繽紛的圖像。
  當將圖像分解成一系列像點、每個點用若干 bit表示時,我們就把這幅圖象數(shù)字化了。
  數(shù)字圖像數(shù)據(jù)量特別巨大,假定畫面上有 150000個點,每個點用 24個 bit來表示,則這幅畫面要占用 450000個字節(jié)。如果想在顯示器上播放視頻信息,一秒鐘需傳送 25幅畫面,相當與 11250000個字節(jié)的信息量。因此,用計算機進行圖像處理,對機器的性能要求是很高的。
  圖像文件的后綴名有: bmp 、 gif 、 jpg 等;

 *聲音的表示
   聲音是一種連續(xù)變化的模擬量,我們可以通過 “模 /數(shù) ”轉換器對聲音信號按固定的時間進行采樣,把它變成數(shù)字量。一旦轉變成數(shù)字形式,便可把聲音儲存在計算機中并進行處理了。
   聲音文件的后綴名有: wav 、 mp3 等;

 *視頻信息的數(shù)字化
  
視頻信息可以看成連續(xù)變換的多幅圖像構成,播放視頻信息,每秒需傳輸和處理 25 幅以上的圖像。視頻信息數(shù)字化后的存儲量相當大,所以需要進行壓縮處理。
   視頻文件后綴名有: avi 、 mpg 等;

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多