Cần một chút trợ giúp về HTML Agility Pack!Trích xuất văn bản bên trong từ nút HTML BODY với Gói nhanh nhạy Html
Về cơ bản, tôi muốn lấy văn bản thuần túy bằng nút cơ thể của HTML. Cho đến nay tôi đã thử điều này trong vb.net và nó không trả lại ý nghĩa innertext không thay đổi được nhìn thấy, cũng ít nhất là từ những gì tôi có thể nhìn thấy.
Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)
Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")
If Not htmldoc Is Nothing Then
For Each node In paragraph
node.ParentNode.RemoveChild(node, True)
Next
End If
Return htmldoc.DocumentNode.WriteContentTo
Tôi đã thử này:
Return htmldoc.DocumentNode.InnerText
Nhưng vẫn không có may mắn!
Bất kỳ lời khuyên nào ???
thể trùng lặp của [Grab tất cả các văn bản từ html với Html Agility Pack] (http://stackoverflow.com/questions/4182594/grab-all-text-from-html- with-html-agility-pack) – richard