bytes類型--python

融水公子 2018-09-11

展開全文

Python的字符串類型是str，在內(nèi)存中以Unicode表示，一個字符對應(yīng)若干個字節(jié)。如果要在網(wǎng)絡(luò)上傳輸，或者保存到磁盤上，就需要把str變?yōu)橐宰止?jié)為單位的bytes。

Python對bytes類型的數(shù)據(jù)用帶b前綴的單引號或雙引號表示：

x = b'ABC'

要注意區(qū)分'ABC'和b'ABC'，前者是str，后者雖然內(nèi)容顯示得和前者一樣，但bytes的每個字符都只占用一個字節(jié)。

以Unicode表示的str通過encode()方法可以編碼為指定的bytes，例如：

--->bytes

>>> 'ABC'.encode('ascii')

b'ABC'

>>> '中文'.encode('utf-8')

b'\xe4\xb8\xad\xe6\x96\x87

--->str

如果我們從網(wǎng)絡(luò)或磁盤上讀取了字節(jié)流，那么讀到的數(shù)據(jù)就是bytes。要把bytes變?yōu)閟tr，就需要用decode()方法：

>>> b'ABC'.decode('ascii')

'ABC'

>>> b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')

'中文'

如果bytes中包含無法解碼的字節(jié)，decode()方法會報錯

bytes中只有一小部分無效的字節(jié)，可以傳入errors='ignore'忽略錯誤的字節(jié)：

>>> b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore')

'中'

當(dāng)str和bytes互相轉(zhuǎn)換時，需要指定編碼。最常用的編碼是UTF-8。Python當(dāng)然也支持其他編碼方式，比如把Unicode編碼成GB2312：

>>> '中文'.encode('gb2312')

b'\xd6\xd0\xce\xc4'

但這種方式純屬自找麻煩，如果沒有特殊業(yè)務(wù)要求，請牢記僅使用UTF-8編碼。

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊一鍵舉報。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自：融水公子 > 《Python》

舉報/認領(lǐng)

0條評論

請遵守用戶評論公約

類似文章 更多

融水公子

關(guān)注對話

喜歡該文的人也喜歡更多

熱門閱讀換一換

日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区