Tôi chưa tìm thấy bất kỳ tài liệu hay hướng dẫn nào cho điều đó. Có bất cứ điều gì như thế tồn tại?Làm cách nào để sử dụng XPath trong Nokogiri?
doc.xpath('//table/tbody[@id="threadbits_forum_251"]/tr')
Đoạn mã trên sẽ làm cho tôi bất kỳ table
, bất cứ nơi nào, có một đứa trẻ tbody
với thuộc tính id
bằng "threadbits_forum_251". Nhưng tại sao nó bắt đầu với đôi //
? Tại sao có /tr
ở cuối? Xem "Ruby Nokogiri Parsing HTML table II" để biết thêm chi tiết.
Ai có thể cho tôi biết làm thế nào để giải nén href
, id
, alt
, src
, vv sử dụng Nokogiri?
td[3]/div[1]/a/text()' <--- extracts text
Tôi có thể trích xuất những thứ khác bằng cách nào?
@Rubens cảm ơn bạn. Và bạn nói đúng Tôi cần đọc Hướng dẫn XPath. Tôi nghĩ rằng đó là tài liệu nokorigi tôi cần đọc ... bạn có biết nếu có bất kỳ công cụ nào có thể cung cấp cho tôi Xpath đầy đủ nếu tôi nhấp và đối tượng trên trang html không? – Radek
Tôi không biết, nhưng XPath không phải là khó; xem xét hệ thống tập tin của bạn, và cho phép giả sử mỗi thư mục là một phần tử XML; vì vậy, khi bạn chọn thư mục 'system32', bạn sẽ nhận được đường dẫn' \ windows \ system32'; chỉ thay thế '\\' 'bằng'/', xem xét các thuộc tính bắt đầu bằng' @ 'và điều kiện bằng' [] 'và bạn tốt để đi –
Tôi biết đây là câu trả lời cũ hơn nhưng liên kết đến hướng dẫn xpath là bây giờ bị hỏng. Tôi nghĩ rằng bây giờ nó sẽ là http://www.w3schools.com/xsl/xpath_intro.asp – Axiombadger