như lớp DOMDocument trong PHP, có bất kỳ lớp nào bằng RUBY (tức là RUBY cốt lõi), để phân tích cú pháp và nhận giá trị của phần tử nút từ Tài liệu HTML hay không.Phương pháp phân tích cú pháp tài liệu HTML trong Ruby?
Trả lời
Hiện chưa có trình phân tích cú pháp HTML được tích hợp sẵn, nhưng một số trình phân tích cú pháp HTML rất tốt có sẵn, cụ thể là Nokogiri.
Câu trả lời meta: Đối với các nhu cầu chung như vậy, tôi khuyên bạn nên xem trang web Ruby Toolbox. Bạn sẽ nhận thấy rằng Nokogiri là đề xuất hàng đầu cho HTML parsers
Bạn nên xem hpricot. Nó cực kỳ tốt. Nó không phải là 'cốt lõi' ruby, nhưng nó là một viên ngọc thường được sử dụng.
Bạn cũng có thể thử Oga bởi Yorick Peterse.
Đây là trình phân tích cú pháp XML/HTML được viết bằng Ruby không yêu cầu thư viện hệ thống như libxml. Bạn có thể tìm thấy nó ở đây. https://github.com/YorickPeterse/oga
Ruby Cheerio - Trình phân tích cú pháp HTML kiểu jQuery trong ruby. Một phiên bản đơn giản nhất của Nokogiri cho trình thu thập thông tin. Đây là phiên bản ruby của gói NodeJS phổ biến nhất cheerio.
Follow the link for a simple crawler example.
gem install ruby-Cheerio
require 'ruby-cheerio'
jQuery = RubyCheerio.new("<html><body><h1 class='one'>h1_1</h1><h1>h1_2</h1></body></html>")
jQuery.find('h1').each do |head_one|
p head_one.text
end
# getting attribute values like jQuery.
p jQuery.find('h1.one')[0].prop('h1','class')
# function chaining similar to jQuery.
p jQuery.find('body').find('h1').first.text
Cách tiếp cận rất tốt! Đề nghị tốt đẹp! Cảm ơn @dineshsprabu. –
Cảm ơn Fernando Kosh – dineshsprabu
- 1. Phân tích cú pháp tài liệu XML trong Ruby
- 2. RUBY Nokogiri HTML HTML Phân tích cú pháp
- 3. Phân tích cú pháp HTML HTML
- 4. Kết hợp phân tích cú pháp phân tích cú pháp, phân tích cú pháp và phân tích cú pháp rừng
- 5. Phân tích cú pháp HTML trong perl
- 6. libxml2 Phân tích cú pháp HTML
- 7. Phân tích cú pháp tài liệu XML trong C#
- 8. Phân tích html với trình phân tích cú pháp SAX
- 9. Không thể phân tích cú pháp html sử dụng lxml XPath phân tích cú pháp
- 10. PHP tags phân tích cú pháp HTML
- 11. Lỗi phân tích cú pháp HTML
- 12. BeautifulSoup HTML bảng phân tích cú pháp
- 13. Trình phân tích cú pháp HTML
- 14. Phân tích cú pháp HTML với Erlang
- 15. Phân tích cú pháp Ruby: phân tích cú pháp nhiều dòng
- 16. Phân tích cú pháp tài liệu RTF bằng Java/JavaCC
- 17. của Ruby Phân Cú pháp
- 18. Phân tích cú pháp tài liệu HTML/XML hoạt động như thế nào?
- 19. Trình phân tích cú pháp HTML python HTML nhanh
- 20. Phân tích cú pháp HTML giống như jquery bằng Python?
- 21. Trình phân tích cú pháp HTML trên Node.js
- 22. Phân tích cú pháp trang html hoàn chỉnh với jquery
- 23. chuỗi phân tích cú pháp html với jquery
- 24. Ruby phân tích cú pháp HTTPresponse với Nokogiri
- 25. Phân tích cú pháp cấu trúc lại thành HTML
- 26. Phân tích cú pháp Atom & RSS trong Ruby/Rails?
- 27. Chuỗi phân tích cú pháp URL trong Ruby
- 28. Tạo trình phân tích cú pháp Brainfuck, phương pháp phân tích cú pháp vòng lặp tốt nhất là gì?
- 29. Phân tích cú pháp RDF trong Smalltalk
- 30. Phân tích cú pháp Javascript bằng mã Ruby
Hpricot buồn bã là không còn nữa. Nokogiri bây giờ là giải pháp ưu tiên. – superluminary