Tôi muốn xóa các trang người dùng của SO để cung cấp cho chủ sở hữu thanh công cụ của tôi thông tin được cập nhật về câu hỏi/câu trả lời của họ ...Cách thực hiện tải nền và cào của trang có XUL/Firefox Extension
Điều này có nghĩa là tôi cần làm điều này trong nền, phân tích các trang, trích xuất nội dung, so sánh nó với lần chạy cuối cùng và sau đó trình bày kết quả trên thanh công cụ hoặc thanh trạng thái, hoặc cách khác, trên cửa sổ bật lên của một số loại. Và tất cả điều này phải được thực hiện trong khi người dùng đang đi về kinh doanh của mình không bị gián đoạn hoặc thậm chí là trên SO.
Tôi đã tìm kiếm khá kỹ lưỡng cả trên Google và trên Mozilla Wiki cho một số loại gợi ý. Tôi thậm chí đã đi đến mức độ tải xuống một vài phần mở rộng khác mà tôi nghĩ rằng làm như vậy. Thật không may tôi đã không có thời gian để đi qua tất cả chúng và những cái tôi đã xem xét, tất cả các API sử dụng dữ liệu (Dịch vụ, WebServices, XML), không phải html scrapping.
Cũ câu hỏi văn bản
Tôi đang tìm kiếm một nơi đẹp để tìm hiểu làm thế nào tôi có thể tải một trang bên trong một hàm gọi là mua set_timeout khét tiếng() để xử lý một màn hình cào ở chế độ nền.
Ý tưởng của tôi là trình bày kết quả của việc cào như vậy trong tiện ích mở rộng thanh trạng thái, chỉ trong trường hợp có bất kỳ điều gì thay đổi từ lần chạy cuối cùng.
Có lớp phủ ẩn hoặc một số bộ phận phụ khác không?
"trang" sau đó có thể được sử dụng làm đối tượng DOM không? –
Tôi đã cố gắng trả lời câu hỏi này trong bản chỉnh sửa của mình. –