2008-10-21 25 views
23

Nguồn cấp dữ liệu RSS của Slashdot là http://rss.slashdot.org/Slashdot/slashdot. Nếu tôi tải xuống tệp XML trực tiếp, tôi chỉ nhận được một vài bài đăng từ hôm nay. Tuy nhiên, nếu tôi đăng ký nguồn cấp dữ liệu trong Google Reader và tiếp tục cuộn xuống trong giao diện "cuộn vô hạn" của họ, có vẻ như tôi có thể nhận được một số bài đăng Slashdot tùy ý từ quá khứ - có thể tôi nhận được mọi bài đăng Slashdot bao giờ?Google Reader nhận được mọi mục trong nguồn cấp dữ liệu RSS như thế nào?

  1. Google Reader lấy số lượng bài đăng không giới hạn từ nguồn cấp dữ liệu RSS như thế nào?
  2. Tôi có thể làm như thế nào?
+1

Tốt câu hỏi, tôi đã tò mò về vấn đề này bản thân mình. – Anton

Trả lời

19

Google tuân theo một phiên bản nguồn cấp dữ liệu cho tất cả người dùng của mình, vì vậy họ đã theo dõi và lưu trữ các bài viết Slashdot, chẳng hạn như lâu trước khi bất kỳ người đăng ký mới nào bắt đầu đọc.

Để làm như vậy, bạn sẽ phải thăm dò ý kiến ​​các nguồn cấp dữ liệu RSS bạn muốn theo khoảng thời gian đều đặn và lưu trữ bất kỳ bài viết duy nhất nào bạn tìm thấy cục bộ.

2

Họ đã lập chỉ mục web trong nhiều năm và lưu trữ mọi thứ họ truy cập. Vì vậy, thời điểm bạn thêm liên kết "đăng ký này" vào trang của bạn, trình thu thập thông tin của Google sẽ bắt đầu lập chỉ mục trang đó và lưu trữ trang đó.

Đối với RSS, chúng cũng có lợi cho việc có nhiều người đăng ký cùng một nguồn cấp dữ liệu. Vì vậy, đối với ứng dụng của bạn, tôi khuyên bạn nên giải quyết điều này bằng cách lưu bất kỳ mục tải xuống cục bộ, để đăng ký mới có thể quay trở lại thời điểm người dùng đầu tiên đăng ký với nguồn cấp dữ liệu đó. Nó sẽ không cung cấp cho bạn không giới hạn, nhưng theo thời gian nó sẽ cung cấp cho bạn một kho lưu trữ lớn hơn nhiều so với chỉ 20 mục mới nhất.

13

Tôi chỉ phát hiện ra rằng nếu bạn đang chứng thực bạn có thể làm một cái gì đó như:

http://www.google.com/reader/atom/feed/http://rss.slashdot.org/Slashdot/slashdot?n=100

để có được một số tùy ý của các kết quả từ thức ăn.

+0

Bất cứ ai bây giờ làm thế nào tôi có thể truy cập nguồn cấp dữ liệu này từ một kịch bản python với feedparser? Chỉ có thể nhận được các mục nhập của nguồn cấp dữ liệu này khi đã đăng nhập vào trình đọc google. Nhưng tôi không biết cách đăng nhập từ tập lệnh ... –

+1

@Rafael - Nếu bạn vẫn đang tìm kiếm, hãy xem câu hỏi này: http://stackoverflow.com/questions/52880/google-reader-api-unread- đếm. Nó có thể giúp. –

+0

Dường như giá trị fo n có thể là tối đa 1000. Nếu bạn cho bất kỳ thứ gì vượt quá 1000, chỉ có 1000 kết quả được trả lại. –

1

Tôi đã tạo một dịch vụ lưu trữ RSS thực hiện những gì bạn đang nói về (https://app.pub.center). Tất cả các RSS là miễn phí để sử dụng thông qua REST. Nếu bạn muốn thông báo đẩy bạn phải chuyển sang gói trả phí.

PubCenter thăm dò ý kiến ​​hàng ngày là danh mục nguồn cấp dữ liệu RSS và lưu trữ các bài viết. Sau đó, bạn có thể lấy lại các bài viết này theo thứ tự thời gian. Ví dụ:

Trang 1 của The Atlantic https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=1

Trang 2 của The Atlantic https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=2

Các vấn đề liên quan