Tôi đang cố gắng tự động tải xuống các Nghiên cứu về Thu nhập Động lực Bảng điều khiển có sẵn trên this web page bằng cách sử dụng R. Nhấp vào bất kỳ tệp nào trong số đó đến số this login/authentication page. Sau khi xác thực, thật dễ dàng để tải xuống các tệp bằng trình duyệt web của bạn. Thật không may, mã số httr
bên dưới dường như không duy trì xác thực. Tôi đã thử kiểm tra Headers
trong Chrome cho trang Login.aspx (as described here), nhưng dường như không duy trì xác thực ngay cả khi tôi tin rằng tôi đang chuyển tất cả các giá trị chính xác. Tôi không quan tâm nếu nó được thực hiện với httr
hoặc RCurl
hoặc cái gì khác, tôi chỉ muốn một cái gì đó hoạt động bên trong R vì vậy tôi không cần phải có người dùng của tập lệnh này phải tải xuống các tệp theo cách thủ công hoặc với một số chương trình hoàn toàn riêng biệt . Một trong những nỗ lực của tôi ở đây là dưới đây, nhưng nó không hoạt động. Bất kỳ trợ giúp sẽ được đánh giá cao. Cảm ơn!! : DCách đăng nhập và sau đó tải xuống tệp từ các trang web aspx có R
require(httr)
values <-
list(
"ctl00$ContentPlaceHolder3$Login1$UserName" = "[email protected]" ,
"ctl00$ContentPlaceHolder3$Login1$Password" = "somepassword" ,
"ctl00$ContentPlaceHolder3$Login1$LoginButton" = "Log In" ,
"_LASTFOCUS" = "" ,
"_EVENTTARGET" = "" ,
"_EVENTARGUMENT" = ""
)
POST("http://simba.isr.umich.edu/u/Login.aspx?redir=http%3a%2f%2fsimba.isr.umich.edu%2fZips%2fZipMain.aspx" , body = values)
resp <- GET("http://simba.isr.umich.edu/Zips/GetFile.aspx" , query = list(file = "1053"))
Bạn phải lưu cookie sau khi xác thực và vượt qua điều đó với mọi cuộc gọi khác - xem ví dụ:http://stackoverflow.com/a/15451157/564164 – daroczig
@daroczig cảm ơn .. tôi thực sự đã cố gắng sao chép một ngày hôm qua, nó không hoạt động. :(có thể bất cứ điều gì khác đang xảy ra? –