Vì vậy, tôi có một danh sách các phụ reddits và tôi đang sử dụng urllib để mở chúng. Như tôi đã đi qua họ cuối cùng urllib không thành công với:Lỗi HTTP urllib2 429
urllib2.HTTPError: HTTP Error 429: Unknown
Làm một số nghiên cứu tôi thấy rằng reddit giới hạn số tiền của các yêu cầu đến các máy chủ của họ bằng cách chỉ IP:
Hãy không quá một yêu cầu mỗi hai giây . Có một số phụ cấp cho các vụ yêu cầu, nhưng giữ cho nó tỉnh táo. Nói chung, hãy giữ không quá 30 yêu cầu trong một phút.
Vì vậy, tôi figured tôi muốn sử dụng time.sleep()
để giới hạn yêu cầu của tôi vào một trang mỗi 10 giây. Điều này cũng không thành công.
Trích dẫn ở trên được lấy từ trang reddit API. Tôi không sử dụng API reddit. Tại thời điểm này tôi đang suy nghĩ hai điều. Giới hạn đó chỉ áp dụng cho API reddit hoặc urllib cũng có giới hạn.
Có ai biết một trong hai điều đó là gì không? Hoặc làm thế nào tôi có thể đi xung quanh vấn đề này?
Không có giới hạn trong 'urllib2', như bạn có thể đã tìm ra bằng cách thử một số trang web khác. Họ có thể đã chặn IP của bạn khỏi quyền truy cập API, hãy thử gửi email cho họ. –
@larsmans Các reqeusts đi qua ngẫu nhiên. Tôi nhận được một số sau đó nó không thành công trong một thời gian và sau đó nó hoạt động trở lại. Ngoài ra họ không thể chặn tôi khỏi API của họ vì tôi không sử dụng API của họ. –