char 與 unsigned char的本質(zhì)區(qū)別
在C中,默認(rèn)的基礎(chǔ)數(shù)據(jù)類型均為signed,現(xiàn)在我們以char為例,說明(signed) char與unsigned char之間的區(qū)別 首先在內(nèi)存中,char與unsigned char沒有什么不同,都是一個(gè)字節(jié),唯一的區(qū)別是,char的最高位為符號位,因此char能表示-128~127, unsigned char沒有符號位,因此能表示0~255,這個(gè)好理解,8個(gè)bit,最多256種情況,因此無論如何都能表示256個(gè)數(shù)字。 在實(shí)際使用過程種有什么區(qū)別呢? 主要是符號位,但是在普通的賦值,讀寫文件和網(wǎng)絡(luò)字節(jié)流都沒什么區(qū)別,反正就是一個(gè)字節(jié),不管最高位是什么,最終的讀取結(jié)果都一樣,只是你怎么理解最高位而已,在屏幕上面的顯示可能不一樣。 但是我們卻發(fā)現(xiàn)在表示byte時(shí),都用unsigned char,這是為什么呢? 首先我們通常意義上理解,byte沒有什么符號位之說,更重要的是如果將byte的值賦給int,long等數(shù)據(jù)類型時(shí),系統(tǒng)會做一些額外的工作。 如果是char,那么系統(tǒng)認(rèn)為最高位是符號位,而int可能是16或者32位,那么會對最高位進(jìn)行擴(kuò)展(注意,賦給unsigned int也會擴(kuò)展) 而如果是unsigned char,那么不會擴(kuò)展。 這就是二者的最大區(qū)別。 同理可以推導(dǎo)到其它的類型,比如short, unsigned short。等等 具體可以通過下面的小例子看看其區(qū)別 include <stdio.h>
void f(unsigned char v) { char c = v; unsigned char uc = v; unsigned int a = c, b = uc; int i = c, j = uc; printf("----------------\n"); printf("%%c: %c, %c\n", c, uc); printf("%%X: %X, %X\n", c, uc); printf("%%u: %u, %u\n", a, b); printf("%%d: %d, %d\n", i, j); }
int main(int argc, char *argv[]) { f(0x80); //10000000 f(0x7F); //01111111 return 0; }
輸出結(jié)果: ---------------- %c: ?, ? %X: FFFFFF80, 80 %u: 4294967168, 128 %d: -128, 128 ---------------- %c: , %X: 7F, 7F %u: 127, 127 %d: 127, 127 由此可見,最高位若為0時(shí),二者沒有區(qū)別,若為1時(shí),則有區(qū)別了。 |
|