Cách dễ nhất để trích xuất dữ liệu có cấu trúc theo chương trình từ một nhóm trang web là gì?Cách dễ nhất để trích xuất dữ liệu có cấu trúc theo chương trình từ một loạt các trang web là gì?
Tôi hiện đang sử dụng chương trình Adobe AIR mà tôi đã viết để theo dõi các liên kết trên một trang và lấy một phần dữ liệu ra khỏi các trang tiếp theo. Điều này thực sự hoạt động tốt, và cho các lập trình viên, tôi nghĩ rằng điều này (hoặc các ngôn ngữ khác) cung cấp một cách tiếp cận hợp lý, được viết trên cơ sở từng trường hợp. Có thể có một ngôn ngữ hoặc thư viện cụ thể cho phép một lập trình viên làm điều này rất nhanh chóng, và nếu vậy tôi sẽ quan tâm đến việc biết chúng là gì. Ngoài ra, còn có công cụ nào cho phép người không lập trình, như đại diện hỗ trợ khách hàng hoặc người phụ trách thu thập dữ liệu, trích xuất dữ liệu có cấu trúc từ trang web mà không cần phải sao chép và dán không?