Bạn có biết bất kỳ tập dữ liệu lớn nào để thử nghiệm với Hadoop miễn phí/chi phí thấp không? Bất kỳ liên kết con trỏ/liên kết nào được đánh giá cao.Các tập dữ liệu lớn miễn phí để thử nghiệm với Hadoop
Prefernce:
Atleast một GB dữ liệu.
Dữ liệu nhật ký sản xuất của máy chủ web.
Rất ít trong số họ mà tôi tìm thấy cho đến nay:
Ngoài ra, chúng tôi có thể chạy trình thu thập thông tin của riêng chúng tôi để thu thập dữ liệu từ các trang web, ví dụ: Wikipedia? Bất kỳ con trỏ nào về cách thực hiện điều này cũng được đánh giá cao.
datanami gần đây đăng tải danh sách các liên kết: http: //www.datanami. com/2015/01/29/9-places-get-big-data-now/- có lẽ ai đó có thời gian để chuyển đổi điều này thành câu trả lời đúng. – Nickolay