Tôi đang tìm cách làm một số phân tích văn bản trong một chương trình tôi đang viết. Tôi đang tìm kiếm các nguồn văn bản thay thế ở dạng thô của nó tương tự như những gì được cung cấp trong các bãi chứa Wikipedia (download.wikimedia.com).Tôi có thể tìm văn bản thô trên web ở đâu?
Tôi không muốn phải trải qua những rắc rối của bò các trang web, cố gắng phân tích html, trích văn bản vv ..
+1 Tôi đến đây để đăng PG. – Joe