2015-11-09 13 views
6

Tôi đang cố gắng để có được kết quả JSON với một tập hợp các trang ngẫu nhiên từ Wikipedia, bao gồm tiêu đề, nội dung và hình ảnh của chúng.Wikipedia API - tải (các) trang ngẫu nhiên

Tôi đã chơi xung quanh với sandbox API của họ, và cho đến nay là tốt nhất tôi nhận được là điều này:

https://en.wikipedia.org/w/api.php?action=query&list=random&format=json&rnnamespace=0&rnlimit=10

Nhưng điều này chỉ bao gồm các không gian tên, id và danh hiệu mười trang ngẫu nhiên . Tôi muốn lấy nội dung cũng như hình ảnh.

Có ai biết không?

Hoặc tôi có thể làm với tiêu đề, nội dung và url hình ảnh của một trang ngẫu nhiên. tốt nhất tôi đã có ở đây là:

https://en.wikipedia.org/w/api.php?action=query&generator=random&format=json

Trả lời

10

Bạn đang gần. generator=random là đúng cách để đi. Sau đó, bạn có thể sử dụng các giá trị prop khác nhau để nhận thông tin bạn muốn:

  • Tiêu đề trang luôn được bao gồm.
  • Để nhận văn bản, hãy sử dụng prop=revisons cùng với rvprop=content.
  • Để nhận tất cả hình ảnh được sử dụng trên trang, hãy sử dụng prop=images.

    Lưu ý rằng điều này thường sẽ bao gồm hình ảnh bạn có thể không quan tâm, như biểu tượng và cờ. Để khắc phục điều đó, bạn có thể thử thay vì prop=pageimages, mặc dù nó dường như không hoạt động. Hoặc bạn có thể thử sử dụng cả hai.

Vì vậy, các truy vấn cuối cùng có thể nhìn như thế này:

https://en.wikipedia.org/w/api.php?format=json&action=query&generator=random&grnnamespace=0&prop=revisions|images&rvprop=content&grnlimit=10

+0

Cảm ơn rất nhiều :) – Petter

Các vấn đề liên quan