2015-07-30 16 views
5

Tôi đang cố gắng xóa một danh sách các sự kiện từ một trang web http://www.cityoflondon.gov.uk/events/, Nhưng khi tháo nó bằng import.io tôi có thể trích xuất chỉ trang đầu tiên.Làm thế nào để cạo nhiều trang bằng Import.io

Tôi làm cách nào để có thể trích xuất tất cả các trang cùng một lúc?

+0

Tôi đã tìm thấy khóa học này trên [Udemy] (https://www.udemy.com/how-to-extract-data-from-the-web) và nó thực sự đã giúp tôi hiểu được Import.io , đặc biệt là trên bài giảng 3, nơi ông giải thích thêm về Trình thu thập thông tin. – Huander

Trả lời

3

Bạn có thể trích xuất dữ liệu với trang web này bằng Trình thu thập thông tin hoặc sử dụng Trích xuất hàng loạt. Trang web trên sử dụng hình thức phân trang rất đơn giản:

http://www.cityoflondon.gov.uk/events/Pages/default.aspx  
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=13  
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=49  
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=25  
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=37 

Đây là Tập dữ liệu tôi đã tạo cho các URL ở trên chứa tất cả thông tin liên quan.

319aebad-88ea-4053-a649-2087011ce041

Nếu bạn có câu hỏi thêm về một trang web cá nhân, vui lòng liên hệ [email protected]

Cảm ơn! Meg

+1

wow, cảm ơn bạn rất nhiều nó là hoàn hảo. – Huander

+1

Rất vui được trợ giúp! Chỉ cần liên hệ với bộ phận hỗ trợ nếu bạn cần bất kỳ điều gì khác trong tương lai. –

Các vấn đề liên quan