2012-06-12 15 views
8

Tôi đang cố gắng tải xuống tệp từ một trang web sử dụng python và cơ giới hóa. Mã hiện tại của tôi đăng nhập thành công vào trang web và mở trang chứa liên kết tải xuống.Tải xuống tệp với cơ chế Python

Liên kết tải xuống là: https://www.lendingclub.com/browse/browseNotesRawDataV2.action

Thông báo thông tin cho các liên kết là:

Link(base_url='https://www.lendingclub.com/browse/browse.action', url='/browse/browseNotesRawDataV2.action', text='', tag='a', attrs=[('class', 'master_pngfix'), ('id', 'browseDownloadAllLink'), ('href', '/browse/browseNotesRawDataV2.action')]) 

tôi sử dụng phương pháp follow_link để nhấp vào liên kết:

br = mechanize.Browser() 
br.follow_link(url='/browse/browseNotesRawDataV2.action') 

Tuy nhiên, không có gì xảy ra và không có tệp nào được tải xuống. Khi tôi mở liên kết trong trình duyệt của mình khi đăng nhập, nó sẽ tạm dừng trong vài giây và tải xuống tệp.

Tôi làm cách nào để tải xuống tệp bằng Python?

+2

Bạn enable log? Bất cứ điều gì bạn đã nhìn thấy ở đó? Bạn đã thử "truy xuất" thay vì follow_link chưa? – niko

+0

Bạn kích hoạt tính năng ghi nhật ký bằng cách nào? Tôi đang sử dụng Eclipse trên một mac. Tôi đã cố gắng lấy lại và không có gì xảy ra. Có cách nào để chỉ ra tên tập tin cần lưu không? – user1137778

+1

Bạn có thể bật tính năng ghi nhật ký bằng 'nhập nhật ký; logging.basicConfig (level = logging.DEBUG) ' –

Trả lời

28

Đối với bất cứ ai quan tâm, đây là giải pháp:

br.retrieve('https://www.lendingclub.com/browse/browseNotesRawDataV2.action','l‌​oans.csv')[0] 
Các vấn đề liên quan