Tôi hiện đang có một tập lệnh nhỏ tải xuống một trang web và trích xuất một số dữ liệu mà tôi quan tâm. Không có gì lạ mắt.HTTPS đăng nhập bằng urllib2
Hiện nay tôi đang tải trang như vậy:
import commands
command = 'wget --output-document=- --quiet --http-user=USER --http-password=PASSWORD https://www.example.ca/page.aspx'
status, text = commands.getstatusoutput(command)
Mặc dù công trình này một cách hoàn hảo, tôi nghĩ rằng nó sẽ làm cho tinh thần để loại bỏ sự phụ thuộc vào wget. Tôi nghĩ rằng nó sẽ là tầm thường để chuyển đổi trên để urllib2, nhưng do đó đến nay tôi đã không thành công. Internet là đầy đủ các ví dụ về urllib2, nhưng tôi không tìm thấy bất kỳ thứ gì phù hợp với nhu cầu xác thực HTTP tên người dùng và mật khẩu đơn giản của tôi với một máy chủ HTTPS.
Trong khi tôi đã có thể ưa thích một cái gì đó trong thư viện chuẩn, điều này có vẻ như là cách rõ ràng để đi. –