Tôi đang cố gắng lấy hình ảnh từ tìm kiếm Hình ảnh của Google cho một truy vấn cụ thể. Nhưng trang tôi tải xuống không có hình ảnh và nó chuyển hướng tôi đến trang gốc của Google. Đây là mã của tôi:Python: URL phù hợp để tải xuống hình ảnh từ Tìm kiếm Hình ảnh của Google
AGENT_ID = "Mozilla/5.0 (X11; Linux x86_64; rv:7.0.1) Gecko/20100101 Firefox/7.0.1"
GOOGLE_URL = "https://www.google.com/images?source=hp&q={0}"
_myGooglePage = ""
def scrape(self, theQuery) :
self._myGooglePage = subprocess.check_output(["curl", "-L", "-A", self.AGENT_ID, self.GOOGLE_URL.format(urllib.quote(theQuery))], stderr=subprocess.STDOUT)
print self.GOOGLE_URL.format(urllib.quote(theQuery))
print self._myGooglePage
f = open('./../../googleimages.html', 'w')
f.write(self._myGooglePage)
Tôi đang làm gì sai?
Cảm ơn
ít nhất bạn phải đóng chốt xử lý –
nó đã hoạt động! cảm ơn – lorussian
@ silviolor: Tôi biết nó không giúp được vấn đề của bạn nhưng tại sao không sử dụng mô-đun 'urllib2' sẵn có của python thay vì' curl'. – RanRag