2013-03-02 35 views
6

Tôi muốn đăng nhập vào trang web sử dụng RCurl và lấy dữ liệu từ các trang web (Các dữ liệu không thể được nhìn thấy mà không cần đăng nhập.)log vào một trang web để lấy các dữ liệu sử dụng RCurl

tôi muốn xuất khẩu này (ví dụ) "http://www.appannie.com/app/ios/instagram/ranking/history/chart_data/?s=2010-10-06&e=2012-06-04&c=143441&f=ranks&d=iphone" vào R sau khi tôi đăng nhập bằng RCurl. Vấn đề là tôi không thể đăng nhập bằng RCurl. Tôi đã không cố gắng này trước khi vì vậy chủ yếu là tôi gọi http://www.omegahat.org/RCurl/philosophy.html.

Vì vậy, đây là những gì tôi đã thử. (Ở đây, '[email protected]' là ID người dùng của tôi và '9999' là Mật khẩu của tôi - tôi chỉ cần làm cho nó lên.)

library(RJSONIO) 
library(rjson) 
library(RCurl) 
appannie <- getURL("http://www.appannie.com/app/ios/instagram/ranking/history/chart_data/.json?s=2010-10-06&e=2012-06-04&c=143441&f=ranks&d=iphone, userpwd = [email protected]:9999", verbose = TRUE) 

Nhưng điều này đã cho tôi được thông báo dưới đây:

About to connect() to www.appannie.com port 80 (#0) 
* Trying 69.167.138.64... * connected 
* Connected to www.appannie.com (69.167.138.64) port 80 (#0) 
> GET /app/ios/instagram/ranking/history/chart_data/?s=2010-10-06&e=2012-06-04&c=143441&f=ranks&d=iphone HTTP/1.1 
Host: www.appannie.com 
Accept: */* 

< HTTP/1.1 403 FORBIDDEN 
< Server: nginx/1.1.19 
< Date: Fri, 01 Mar 2013 23:41:32 GMT 
< Content-Type: text/html; charset=utf-8 
< Transfer-Encoding: chunked 
< Connection: keep-alive 
< Keep-Alive: timeout=10 
< Vary: Accept-Encoding 
< Vary: Cookie,Accept-Encoding 
< 
* Connection #0 to host www.appannie.com left intact 

Vì vậy, tôi đã quay trở lại và đọc này http://www.omegahat.org/RCurl/philosophy.html một lần nữa và không biết phải làm gì, vì vậy tôi đã thử điều này sau khi tôi thấy câu hỏi tương tự từ stackoverflow.

getURL("http://www.appannie.com/app/ios/instagram/ranking/history/chart_data/?s=2010-10-06&e=2012-06-04&c=143441&f=ranks&d=iphone",.opts=list([email protected]:9999")) 

Nhưng điều này mang lại cho tôi kết quả dưới đây.

[1] "" 

Có ai cho tôi gợi ý không? (Sau khi một loạt các thử nghiệm khác nhau, trang web bắt đầu gửi cho tôi cảnh báo = (

+0

không giúp đỡ này 'appannie <-. getURL (" http://www.appannie.com/app/ ios/instagram/ranking/history/chart_data/.json? s = 2010-10-06 & e = 2012-06-04 & c = 143441 & f = xếp hạng & d = iphone ", userpwd =" [email protected]: 9999 ", verbose = TRUE) '? nhìn vào ' ? GetURL' –

+1

Bạn đã đọc [bài đăng blog] của họ chưa (http://blog.appannie.com/hourly-rankings-parent-publishers-data-export-analytics-api/) về api cho phép bạn truy cập dữ liệu lập trình như đang ở phiên bản beta riêng tư? Có lẽ bạn sẽ có nhiều may mắn hơn bằng cách đăng ký tại [email protected] Rõ ràng, bạn cũng có thể tải xuống dữ liệu .csv cho ứng dụng của riêng mình. –

+0

@Eric, cảm ơn bạn đã trả lời. btw, sự khác biệt giữa mã đầu tiên mà tôi đã sử dụng và mã mà bạn đặt là gì? (bằng cách nào đó nó trông giống với tôi ..) – user1486507

Trả lời

0

Đây là một số loại vấn đề xác thực không bất cứ điều gì bạn đã làm sai với RCurl khả thi nhất.

Bạn đột phá vòng vây đến máy chủ nhưng một trong hai đăng nhập của bạn không chính xác, đó là không hợp lệ hoặc các dữ liệu không có sẵn qua API

http://en.wikipedia.org/wiki/HTTP_403

Các vấn đề liên quan