tôi gặp HTML này:Làm thế nào để trích xuất văn bản con với Nokogiri?
<div class='featured'>
<h1>
How to extract this?
<span>Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.</span>
<span class="moredetail ">
<a href="/hello" title="hello">hello</a>
</span>
<div class="clear"></div>
</h1>
</div>
tôi muốn trích xuất văn bản <h1>
"How to extract this?
". Làm thế nào để tôi làm như vậy?
Tôi đã thử với mã sau đây, nhưng có phần tử khác được nối vào. Tôi không chắc chắn cách loại trừ chúng để tôi chỉ nhận được văn bản <h1>
.
doc = Nokogiri::HTML(open(url))
records = doc.css(".featured h1")
Bạn có thể sử dụng văn bản() với selectors css cũng như xpath: .at ('đặc trưng văn bản h1()') văn bản – pguardiario
@. pguardiario Nifty. Đó là điều tôi không biết. –