7

Có một thư viện/gói tốt để thực hiện việc cào web bằng cách sử dụng Đề án (tốt nhất là Racket) không?Dò web bằng Lược đồ

ví dụ: một Đề án tương đương với mechanize?

+0

HTML hợp lệ (đọc XML) có thể dễ dàng được phân tích cú pháp thành biểu thức S. – leppie

+0

Đúng, nhưng điều gì về việc gửi biểu mẫu html, điều hướng liên kết, v.v ...? – abeln

+0

Tôi chắc chắn Racket có một số thư viện http-client/web-client. – leppie

Trả lời

7

Tôi đã sử dụng kết hợp thư viện Racket net/url, html-parsing packageSXML (đặc biệt là sxpath, cho các truy vấn XPath). Trên thực tế, tôi đã viết some wrappers xung quanh net/url giúp dễ sử dụng hơn, IMO.

Khi tôi cần xử lý cookie, tôi đã gọi đến lệnh curl thay vì sử dụng net/url.

Các vấn đề liên quan