轉載地址:https://www.cnblogs.com/zhangxinqi/p/9210211.html 最近在看html頁面解析的東西,html解析可以用beautifulsoup 或者lxml,lxml是python的一個解析庫,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高 XPath,全稱XML Path Language,即XML路徑語言,它是一門在XML文檔中查找信息的語言,它最初是用來搜尋XML文檔的,但是它同樣適用于HTML文檔的搜索 XPath的選擇功能十分強大,它提供了非常簡明的路徑選擇表達式,另外,它還提供了超過100個內建函數(shù),用于字符串、數(shù)值、時間的匹配以及節(jié)點、序列的處理等,幾乎所有我們想要定位的節(jié)點,都可以用XPath來選擇 這里寫博客記錄下,留著備用 https://www.cnblogs.com/zhangxinqi/p/9210211.html |
|
來自: Four兄 > 《Python筆記》