7
Có một thư viện/gói tốt để thực hiện việc cào web bằng cách sử dụng Đề án (tốt nhất là Racket) không?Dò web bằng Lược đồ
ví dụ: một Đề án tương đương với mechanize?
Có một thư viện/gói tốt để thực hiện việc cào web bằng cách sử dụng Đề án (tốt nhất là Racket) không?Dò web bằng Lược đồ
ví dụ: một Đề án tương đương với mechanize?
Tôi đã sử dụng kết hợp thư viện Racket net/url, html-parsing package và SXML (đặc biệt là sxpath
, cho các truy vấn XPath). Trên thực tế, tôi đã viết some wrappers xung quanh net/url giúp dễ sử dụng hơn, IMO.
Khi tôi cần xử lý cookie, tôi đã gọi đến lệnh curl
thay vì sử dụng net/url.
HTML hợp lệ (đọc XML) có thể dễ dàng được phân tích cú pháp thành biểu thức S. – leppie
Đúng, nhưng điều gì về việc gửi biểu mẫu html, điều hướng liên kết, v.v ...? – abeln
Tôi chắc chắn Racket có một số thư viện http-client/web-client. – leppie