房屋網(wǎng)簽查詢系統(tǒng)官方網(wǎng)站知乎推廣
概念
XPath (XML Path Language) 是一門在 XML 文檔中查找信息的語言,可用來在 XML 文檔中對元素和屬性進行遍歷。
XPath定位在爬蟲和自動化測試中都比較常用,通過使用路徑表達式來選取 XML 文檔中的節(jié)點或者節(jié)點集,熟練掌握XPath可以極大提高提取數(shù)據(jù)的效率。
因為XPath解析數(shù)據(jù),是基于元素(Element)的樹形結(jié)構(gòu),所以學(xué)習(xí)XPath前,先了解一下html的結(jié)構(gòu)及常用標簽。
XPath常用的定位方式:
1.元素屬性,快速定位,唯一屬性:?//*[@id="images"]
2.層級與屬性結(jié)合,解決沒有屬性問題://div[@id="images"]/a[1]
3.屬性與邏輯結(jié)合,解決多個屬性重名問題://*[@id="su" and @class="bg s_btn" ]
那么,如何在瀏覽器中查找和驗證XPath?
1.使用Chrome瀏覽器的開發(fā)者工具,可以快速獲取XPath表達式:
點擊選擇光標,選擇頁面上的元素位置,在控制臺右鍵選擇Copy XPath,表達式就復(fù)制到粘貼板中了。
2.驗證表達式:
按鍵“Ctrl+F”,在控制臺中輸入需要檢查的XPath路徑,對應(yīng)的元素會有的顏色標識
熟練使用XPath來定位頁面中的元素,能有效幫助你在開發(fā)過程中提升效率和完成工作