Tôi đã cố gắng hiểu những điều cơ bản của MapReduce trong MongoDB và thậm chí sau khi triển khai nó, tôi không chắc chính xác nó khác với GROUP BY của SQL hoặc thậm chí GROUP BY của riêng Mongo như thế nào. Trong SQL server, một GROUP BY có thể được thực hiện bằng stream hoặc hash aggregate. MapReduce không giống với tổng hợp băm, chỉ trên một số lượng lớn máy chủ?
MapReduce và SQL GROUP BY
Tôi đã đọc ở những nơi mà MR cho MongoDB sẽ được chạy dưới dạng nền tảng vì nó là "hoạt động nặng". Cho rằng dữ liệu được phân mảnh, sẽ không một GROUP BY được bằng nhau "nặng"? Điều đó nói rằng, tôi chỉ cố gắng để so sánh các loại hoạt động có thể được thực hiện cả hai như là một công việc MR hoặc sử dụng truy vấn GROUP BY.
Có điều gì mà GROUP BY không thể làm và chỉ MR có thể thực hiện?
Ngoài ra, Hadoop có vẻ rất giỏi MR (Đây chỉ là những gì tôi đã đọc..Tôi chưa bao giờ làm việc trên Hadoop). MR của Hadoop khác với MR của Mongo như thế nào?
Tôi đang bối rối. Vui lòng giúp đỡ hoặc hướng dẫn tôi đến một hướng dẫn tốt giải thích sự cần thiết của MapReduce.
Cảm ơn thông tin chi tiết..Một khi tôi xác định rằng MapReduce về cơ bản là 'triết lý' và có thể được theo dõi trong máy chủ SQL, nếu chúng tôi có thể tạo bảng mới và lưu trữ kết quả MR trung gian vào họ? –
Đừng quên đánh dấu là câu trả lời nếu nó trả lời câu hỏi của bạn hoặc ít nhất là bỏ phiếu! :) – Ms01
biểu đồ đẹp :) Được thăng hạng .... –