Ở quốc gia của tôi, nhiều trang web bị kiểm duyệt và bị chặn và thay vào đó được chuyển hướng đến một trang nhất định. Tôi không biết làm thế nào họ chính xác làm điều này. Nhưng có thể xác định theo chương trình nếu một trang web bị bị chặn hoặc không phải là bị chặn mà không tải toàn bộ nội dung? Lý do tôi muốn làm điều này là sử dụng API tìm kiếm trên web (có thể là của Google) và tạo một dịch vụ web chỉ mang lại kết quả không bị chặn.Kiểm tra chuyển hướng trang web, lập trình
Nếu nó giúp, nội dung của trang đó tải thay vì là như thế này:
<html><head><meta http-equiv="Content-Type" content="text/html; charset=windows-1256"><title>M3-5
</title></head><body><iframe src="http://10.10.34.34?type=Invalid Site&policy=MainPolicy " style="width: 100%; height: 100%" scrolling="no" marginwidth="0" marginheight="0" frameborder="0" vspace="0" hspace="0"></iframe></body></html>
Tôi hiểu rằng các máy chủ chạy dịch vụ sẽ phải có IP nước tôi.
Sẽ là tốt nhất nếu có cách để thực hiện việc này bằng PHP hoặc Python.
Tôi đánh giá cao bất kỳ trợ giúp hoặc ý tưởng nào.
Nếu trang web bị chặn trả lại 301 có lẽ bạn chỉ có thể thực hiện yêu cầu HEAD và kiểm tra xem đó có phải là thông báo trạng thái 301 hay không. Nếu đó là sau đó bạn có thể kiểm tra thêm nó để xem nếu nó có chứa 'Trang web không hợp lệ'. Điều này sẽ giúp bạn tiết kiệm được tất cả các trang bỏ chặn. Một số trang web được bỏ chặn cũng sẽ có 301. – dm03514
Cảm ơn. OK, tôi đã kiểm tra một vài trang bị chặn. Hầu hết trong số họ đã trả lại 301. Một trong số họ trả lại 302. Nhưng facebook.com chẳng hạn không trả lại bất kỳ thứ gì (có, facebook bị chặn ở đây!) Và flickr.com trả về 200. Bạn có bất kỳ đầu mối nào không? – Auxiliary