2010-02-11 40 views
8

Từ đoạn mã HTML sau đây:Bắt trị thuộc tính nhất định sử dụng XPath

<link rel="index" href="/index.php" /> 
<link rel="contents" href="/getdata.php" /> 
<link rel="copyright" href="/blabla.php" /> 
<link rel="shortcut icon" href="/img/all/favicon.ico" /> 

Tôi đang cố gắng để có được những giá trị href của thẻ link với giá trị rel = "shortcut icon", tôi đang cố gắng để đạt được điều đó bằng XPath .

Làm thế nào để thực hiện điều đó bằng Python?

Trả lời

15

Như sau:

data = """<link rel="index" href="/index.php" /> 
<link rel="contents" href="/getdata.php" /> 
<link rel="copyright" href="/blabla.php" /> 
<link rel="shortcut icon" href="/img/all/favicon.ico" /> 
""" 

from lxml import etree 

d = etree.HTML(data) 

d.xpath('//link[@rel="shortcut icon"]/@href') 
['/img/all/favicon.ico'] 
Các vấn đề liên quan