日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

程序員學(xué)習(xí)—學(xué)會(huì)使用Python爬蟲(chóng)正則表達(dá)式

 flyk0tcfb46p9f 2019-05-19

此次課程我們會(huì)系統(tǒng)的學(xué)習(xí)一下python的正則表達(dá)式,以及可以根據(jù)自己的需求寫(xiě)出正確的正則表達(dá)式。2學(xué)習(xí)此次課程,需要多久?15-20分鐘,建議每個(gè)表達(dá)式跟著實(shí)踐一下,加深印象3課程內(nèi)容

Python中正則表達(dá)式 在 re 模塊 — Regular expression operations

Python中的re模塊提供與Perl類(lèi)似的正則表達(dá)式匹配操作,但是要注意的是:正則匹配時(shí) 表達(dá)式和要查詢(xún)的字符串可以是 unicode字符串,也可是8-bit 字符串,但是兩種模式不可以混合使用,也就是說(shuō) 表達(dá)式和要查詢(xún)的字符串必須一致。

正則表達(dá)式特殊字符:

.(點(diǎn)): 默認(rèn)模式下,.可以匹配除了換行外的所有字符,如果需要匹配換行,可以傳參 re.DOTALL。

image

運(yùn)行結(jié)果:

image

^:只匹配字符串的開(kāi)始位置,可以使用re.MULTILINE(匹配多行),匹配每一行的開(kāi)始位置。

image

代碼中每一行的開(kāi)頭都有ae字符串,所以開(kāi)啟多行模式后,會(huì)匹配兩個(gè)結(jié)果。

運(yùn)行結(jié)果:

image

$ : 與^相反,匹配字符串的結(jié)束位置,可以使用re.MULTILINE(匹配多行),匹配每一行的結(jié)尾位置。

image

運(yùn)行結(jié)果:

image

.: 匹配0個(gè)或多個(gè)的表達(dá)式

image

運(yùn)行結(jié)果:

image

分析:c*表示,匹配字符'c'0次或者多次,也就是說(shuō)會(huì)匹配 a,ac。

+: 匹配1個(gè)或多個(gè)的表達(dá)式

image

運(yùn)行結(jié)果:

image

分析:匹配字符a并且c一次或者多次,所以會(huì)匹配ac或者accccc

? : 匹配0次或1次,非貪婪方式

image

運(yùn)行結(jié)果:

分析:表達(dá)式“ac?” 匹配字符a或者ac(?只匹配0次或者1次,比較懶惰,不像上面的+或者*會(huì)匹配多次)

.? : 這三個(gè)特殊符號(hào)上面都講過(guò)了,.是匹配任意字符匹配0次或者多次,連在一起使用也就是匹配全文了,加上?號(hào),非貪婪模式匹配,將盡可能少的匹配結(jié)果。

image

匹配結(jié)果:

image

4小結(jié)正則匹配的語(yǔ)法是通用的,大家學(xué)會(huì)這些特殊字符,無(wú)論什么語(yǔ)言都能迅速入門(mén)。所以有必要好好學(xué)習(xí)一下。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶(hù)發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多