Tôi vẫn bị kẹt trong vấn đề cố gắng phân tích các bài viết từ wikipedia. Trên thực tế, tôi muốn phân tích cú pháp phần thông tin của các bài viết từ wikipedia tức là ứng dụng của tôi có tham chiếu đến các quốc gia và trên mỗi trang quốc gia tôi muốn có thể hiển thị hộp thông tin trên bài viết wikipedia tương ứng của quốc gia đó. Tôi đang sử dụng php ở đây - Tôi sẽ đánh giá rất cao nếu bất cứ ai có bất kỳ đoạn mã hoặc lời khuyên về những gì tôi nên làm ở đây.Làm cách nào để lấy thông tin được phân tích cú pháp của một bài viết wikipedia?
Xin cảm ơn một lần nữa.
EDIT
Vâng, tôi có một bảng db với tên của quốc gia. Và tôi có một kịch bản có một quốc gia và thể hiện chi tiết của nó. Tôi muốn lấy các infobox - hộp màu xanh với tất cả các chi tiết hình ảnh quốc gia vv vì nó là từ wikipedia và hiển thị nó trên trang của tôi. Tôi muốn biết một cách thực sự đơn giản và dễ dàng để thực hiện điều đó - hoặc có một kịch bản chỉ tải xuống thông tin của hộp thông tin đến một hệ thống từ xa cục bộ mà tôi có thể truy cập sau này. Ý tôi là tôi mở cửa cho những ý tưởng ở đây - ngoại trừ kết quả cuối cùng tôi muốn là để xem hộp thông tin trên trang của mình - tất nhiên với một chút nội dung của liên kết Wikipedia ở phía dưới :)
EDIT
Tôi nghĩ mình đã tìm thấy thứ mình đang tìm kiếm trên http://infochimps.org - chúng có rất nhiều bộ dữ liệu trong ngôn ngữ YAML. Tôi có thể sử dụng thông tin này ngay lập tức nhưng tôi cần một cách để cập nhật thông tin này từ wikipedia ngay bây giờ và sau đó mặc dù tôi tin rằng infoboxes hiếm khi thay đổi đặc biệt là các quốc gia trừ khi một số quốc gia quyết định thay đổi thành phố thủ đô của họ.
Đây là một sự lãng phí tài nguyên. –
Xin lỗi - Tôi có thể thấy những gì bạn muốn nói bởi một lượng lớn tài nguyên. Tôi không có ý định cạo trang này mỗi khi có ai đó trên trang web của bạn cần xem xét nó. Tôi sẽ nghĩ rằng bạn sẽ cạo nó ngoại tuyến (nếu bạn chọn làm như vậy) và lưu trữ nó trong một DB địa phương trên các ứng dụng của bạn kết thúc (cách hiệu quả hơn cho tất cả các bên liên quan).Không có nghĩa là để thu hút ngọn lửa! : P –
@Andrew - Tôi mở cho tất cả các khả năng - tuy nhiên tôi không chắc chắn cách bắt đầu. Có bất kỳ loại mã làm việc nào mà tôi có thể xem xét để bắt đầu với điều này không? – Ali