作者:程序猿小卡_casperhttps://segmentfault.com/u/chyingp 在web服務(wù)端開發(fā)中,字符的編解碼幾乎每天都要打交道。編解碼一旦處理不當(dāng),就會(huì)出現(xiàn)令人頭疼的亂碼問題。 不少從事node服務(wù)端開發(fā)者,由于對(duì)字符編碼碼相關(guān)知識(shí)了解不足,遇到問題時(shí),經(jīng)常會(huì)一籌莫展,花大量的時(shí)間在排查、解決問題。 文本先對(duì)字符編解碼的基礎(chǔ)知識(shí)進(jìn)行簡單介紹,然后舉例說明如何在node中進(jìn)行編解碼,最后是服務(wù)端的代碼案例。本文相關(guān)代碼示例可在這里找到。 一 關(guān)于字符編解碼在網(wǎng)絡(luò)通信的過程中,傳輸?shù)亩际嵌M(jìn)制的比特位,不管發(fā)送的內(nèi)容是文本還是圖片,采用的語言是中文還是英文。 舉個(gè)例子,客戶端向服務(wù)端發(fā)送'你好'。
這中間包含了兩個(gè)關(guān)鍵步驟,分別對(duì)應(yīng)的是編碼、解碼。
總結(jié)一下
上面有些重要的技術(shù)細(xì)節(jié)沒有提到,答案在下一小節(jié)。
二 關(guān)于字符集和字符編碼上面提到字符、二進(jìn)制的轉(zhuǎn)換問題。既然兩者可以互相轉(zhuǎn)換,也就是說存在明確的轉(zhuǎn)換規(guī)則,可以實(shí)現(xiàn)字符<->二進(jìn)制的相互轉(zhuǎn)換。 這里提到的轉(zhuǎn)換規(guī)則,其實(shí)就是我們經(jīng)常聽到的字符集&字符編碼。 字符集是一系列字符(文字、標(biāo)點(diǎn)符號(hào)等)的集合。字符集有很多,常見的有ASCII、Unicode、GBK等。不同字符集主要的區(qū)別在于包含字符個(gè)數(shù)的不同。 了解了字符集的概念后,接下來介紹下字符編碼。 字符集告訴我們支持哪些字符,但具體字符怎么編碼,是由字符編碼決定的。比如Unicode字符集,支持的字符編碼有UTF8(常用)、UTF16、UTF32。 概括一下:
可以把字符編碼看成一個(gè)映射表,客戶端、服務(wù)端就是根據(jù)這個(gè)映射表,來實(shí)現(xiàn)字符跟二進(jìn)制的編解碼轉(zhuǎn)換。 舉個(gè)例子,'你'這個(gè)字符,在UTF8編碼中,占據(jù)三個(gè)字節(jié) 三 字符編解碼例子上面已經(jīng)提到了字符編解碼所需的基礎(chǔ)知識(shí)。下面我們看一個(gè)簡單的例子,這里借助了 可以看到,在字符編碼時(shí),我們采用了 var iconv = require('iconv-lite'); var oriText = '你'; var encodedBuff = iconv.encode(oriText, 'gbk'); console.log(encodedBuff); // var decodedText = iconv.decode(encodedBuff, 'gbk'); console.log(decodedText); // 你 var wrongText = iconv.decode(encodedBuff, 'utf8'); console.log(wrongText); // ?? 四 實(shí)際例子:服務(wù)端編解碼通常我們需要處理編解碼的場景有文件讀寫、網(wǎng)絡(luò)請求處理。這里距網(wǎng)絡(luò)請求的例子,介紹如何在服務(wù)端進(jìn)行編解碼。 假設(shè)我們運(yùn)行著如下http服務(wù),監(jiān)聽來自客戶端的請求??蛻舳藗鬏敂?shù)據(jù)時(shí)采用了 如果此時(shí)采用默認(rèn)的 服務(wù)端代碼如下(為簡化代碼,這里跳過了請求方法、請求編碼的判斷) var http = require('http'); var iconv = require('iconv-lite'); // 假設(shè)客戶端采用post方法,編碼為gbk var server = http.createServer(function (req, res) { var chunks = [];
req.on('data', function (chunk) { chunks.push(chunk) }); req.on('end', function () { chunks = Buffer.concat(chunks); // 對(duì)二進(jìn)制進(jìn)行解碼 var body = iconv.decode(chunks, 'gbk'); console.log(body); res.end('HELLO FROM SERVER'); }); }); server.listen(3000); 對(duì)應(yīng)的客戶端代碼如下: var http = require('http'); var iconv = require('iconv-lite'); var charset = 'gbk'; // 對(duì)字符'你'進(jìn)行編碼 var reqBuff = iconv.encode('你', charset); var options = { hostname: '127.0.0.1', port: '3000', path: '/', method: 'POST', headers: { 'Content-Type': 'text/plain', 'Content-Encoding': 'identity', 'Charset': charset // 設(shè)置請求字符集編碼 } }; var client = http.request(options, function(res) { res.pipe(process.stdout); }); client.end(reqBuff);
|
|