Tôi mới sử dụng clojure và tôi cần một số ví dụ. Vui lòng chỉ cho tôi cách phân tích cú pháp tệp html bằng clojure?Cách phân tích cú pháp tệp html bằng clojure?
Trả lời
Enlive là một công cụ tuyệt vời cho việc này. Nói tóm lại:
(ns foo.bar
(:require [net.cgrand.enlive-html :as html]))
(defn fetch-page [url]
(html/html-resource (java.net.URL. url)))
Here là một hướng dẫn tốt đẹp về việc sử dụng nó cả hai như là một scraper/phân tích cú pháp và như là một mẫu động cơ:
Here là một ví dụ ngắn cạo một trang.
Tùy chọn khác là clj-tagsoup. Phần mở rộng cũng sử dụng các thẻ, nhưng ngoài ra còn có một trình phân tích cú pháp có thể cắm để bạn có thể thêm hỗ trợ cho các trình phân tích cú pháp khác.
Tôi có thể phân tích cú pháp tệp html mà không cần một trình phân tích cú pháp hoặc trình phân tích cú pháp khác, chỉ sử dụng clojure không? – slawter
Vâng, bạn có thể lấy nội dung của trang web dưới dạng chuỗi chỉ bằng cách thực hiện: (slurp "http://www.example.com"), nhưng để làm việc với nội dung theo cách có thể quản lý, bạn cần một trình phân tích cú pháp (như phóng đại). – ebaxt
Clojure's xmlparsing thư viện có sẵn cho bạn.
Phân tích và tải nguồn s, có thể là Tệp, Dòng đầu vào hoặc Chuỗi đặt tên cho URI. Trả về một cây của sơ đồ cấu trúc xml/element, có thẻ: thẻ,: attrs và: content. và thẻ fns accessor, attrs và nội dung. phân tích cú pháp khác có thể được cung cấp bằng cách đi qua startparse, một fn tham gia một nguồn và một ContentHandler và trả về một phân tích cú pháp
Hoặc sử dụng enlive, đó là khuôn khổ đầy đủ trên clojure hoặc sử dụng Java dựa HtmlCleaner.
- 1. Phân tích cú pháp của Clojure
- 2. Phân tích cú pháp html bằng cách sử dụng C
- 3. Phân tích cú pháp HTML HTML
- 4. Phân tích html với trình phân tích cú pháp SAX
- 5. Mẹo để phân tích cú pháp Html và lướt web bằng clojure?
- 6. Trình phân tích cú pháp HTML
- 7. libxml2 Phân tích cú pháp HTML
- 8. Kết hợp phân tích cú pháp phân tích cú pháp, phân tích cú pháp và phân tích cú pháp rừng
- 9. Phân tích cú pháp HTML trong perl
- 10. Phân tích cú pháp HTML giống như jquery bằng Python?
- 11. Phân tích cú pháp thẻ html bằng Python
- 12. BeautifulSoup HTML bảng phân tích cú pháp
- 13. Phân tích cú pháp HTML với Erlang
- 14. Lỗi phân tích cú pháp HTML
- 15. PHP tags phân tích cú pháp HTML
- 16. Không thể phân tích cú pháp html sử dụng lxml XPath phân tích cú pháp
- 17. "Lỗi khi phân tích cú pháp tệp XML" khi phân tích cú pháp bằng cách sử dụng XInclude
- 18. Làm cách nào để phân tích cú pháp HTML bằng html5lib và truy vấn HTML được phân tích cú pháp bằng XPath?
- 19. Phân tích cú pháp XML bằng Python
- 20. Phân tích cú pháp các tệp mbox bằng Python
- 21. Ocaml - Tệp và phân tích cú pháp
- 22. RUBY Nokogiri HTML HTML Phân tích cú pháp
- 23. Trình phân tích cú pháp HTML python HTML nhanh
- 24. C# Phân tích cú pháp tệp XML
- 25. Phân tích cú pháp xml bằng powershell
- 26. Phân tích cú pháp cấu trúc lại thành HTML
- 27. Perl, cách phân tích cú pháp tệp XML, xpath
- 28. làm cách nào để phân tích cú pháp tệp dtd
- 29. Phân tích cú pháp HTML từ một trang web
- 30. HTML Agility pack - các bảng phân tích cú pháp
Hãy thử http://stackoverflow.com/questions/3628958/good-clojure-code-examples –