MapReduce có trừu tượng hóa một cách tốt để xử lý các vấn đề ngay cả trong một máy đơn lẻ không? Ví dụ, tôi có một máy 12 lõi và tôi phải đếm các từ trong hàng ngàn tệp (ví dụ MapReduce cổ điển).MapReduce có phù hợp để giải quyết các vấn đề trong môi trường đa lõi trong một bộ máy đơn không?
Sử dụng triển khai MapReduce với Mappers và Reducers trong nhiều chủ đề là một cách hay để giải quyết vấn đề này, xem xét rằng chúng tôi đang làm việc trên một máy duy nhất với một ổ cứng?
Tôi đoán câu hỏi của tôi là: Mô hình MapReduce có tốt để làm việc trong một cụm máy không?
Tôi đặt cược "đĩa đơn" là điểm lớn. Tôi hy vọng một lõi đơn có thể chạy 'isspace (3)' trên các ký tự đến từ một đĩa cứng quay nhanh như ổ đĩa có thể phục vụ chúng. Có bất kỳ tệp nào trong bộ đệm đệm vì chúng thường được sử dụng không? – sarnold
Để làm cho nó thú vị hơn, sau đó, chúng ta có thể nói rằng chúng tôi có một bộ đệm lớn các tập tin trong bộ nhớ. Giả sử chúng ta có 16GB bộ nhớ RAM để giữ các tệp và công việc MapReduce tiêu thụ bộ đệm này. Và nếu không có độ trễ Đĩa? Nếu tất cả dữ liệu trong RAM? –
Trong trường hợp đó, tôi mong đợi nhiều luồng tính toán đáng giá. – sarnold