Bạn có thể trích xuất dữ liệu với trang web này bằng Trình thu thập thông tin hoặc sử dụng Trích xuất hàng loạt. Trang web trên sử dụng hình thức phân trang rất đơn giản:
http://www.cityoflondon.gov.uk/events/Pages/default.aspx
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=13
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=49
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=25
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=37
Đây là Tập dữ liệu tôi đã tạo cho các URL ở trên chứa tất cả thông tin liên quan.
319aebad-88ea-4053-a649-2087011ce041
Nếu bạn có câu hỏi thêm về một trang web cá nhân, vui lòng liên hệ [email protected]
Cảm ơn! Meg
Nguồn
2015-08-03 15:16:34
Tôi đã tìm thấy khóa học này trên [Udemy] (https://www.udemy.com/how-to-extract-data-from-the-web) và nó thực sự đã giúp tôi hiểu được Import.io , đặc biệt là trên bài giảng 3, nơi ông giải thích thêm về Trình thu thập thông tin. – Huander