2016-07-20 21 views
12

Tôi cần phân tích cú pháp số site, nhưng tôi bị lỗi 403 Cấm. Đây là một mã số:Yêu cầu Python. 403 Forbidden

url = 'http://worldagnetwork.com/' 
result = requests.get(url) 
print(result.content.decode()) 

đầu ra của nó:

<html> 
<head><title>403 Forbidden</title></head> 
<body bgcolor="white"> 
<center><h1>403 Forbidden</h1></center> 
<hr><center>nginx</center> 
</body> 
</html> 

Xin vui lòng, nói rằng vấn đề là gì.

Trả lời

38

Dường như trang từ chối yêu cầu GET không xác định được User-Agent. Tôi đã đến thăm trang web với một trình duyệt (Chrome) và sao chép User-Agent header của yêu cầu GET (nhìn vào tab Mạng trong những công cụ phát triển):

import requests 
url = 'http://worldagnetwork.com/' 
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'} 
result = requests.get(url, headers=headers) 
print(result.content.decode()) 

# <!doctype html> 
# <!--[if lt IE 7 ]><html class="no-js ie ie6" lang="en"> <![endif]--> 
# <!--[if IE 7 ]><html class="no-js ie ie7" lang="en"> <![endif]--> 
# <!--[if IE 8 ]><html class="no-js ie ie8" lang="en"> <![endif]--> 
# <!--[if (gte IE 9)|!(IE)]><!--><html class="no-js" lang="en"> <!--<![endif]--> 
# ... 
+0

Cảm ơn bạn rất nhiều! –

+0

đã làm việc cho tôi, cảm ơn u –

+0

tôi không hiểu tại sao lỗi đó bắt đầu bật lên đối với tôi, lỗi này đã hoạt động vài giờ trước. Nhưng giải pháp của bạn đã hoạt động hoàn hảo, cảm ơn! – rodrigorf

Các vấn đề liên quan