Đúng nếu tôi sai, nhưng hiểu biết của tôi là Hadoop không sử dụng MPI để liên lạc giữa các nút khác nhau.Tại sao Hadoop không triển khai bằng MPI?
Lý do kỹ thuật cho điều này là gì?
Tôi có thể gây nguy hiểm cho một vài dự đoán, nhưng tôi không biết đủ về cách thức thực hiện MPI "dưới mui xe" để biết tôi có đúng hay không.
Nghĩ lại thì tôi cũng không hoàn toàn quen thuộc với nội bộ của Hadoop. Tôi hiểu khuôn khổ ở một mức độ khái niệm (bản đồ/kết hợp/trộn/giảm và cách hoạt động ở mức cao) nhưng tôi không biết chi tiết thực hiện gritty nitty. Tôi đã luôn luôn giả định Hadoop đang truyền các cấu trúc dữ liệu tuần tự (có lẽ là GPBs) qua kết nối TCP, ví dụ như trong giai đoạn trộn. Hãy cho tôi biết nếu điều đó không đúng.
Vì vậy, bạn đang nói lý do không phải là vốn có của MPI mô hình chính nó, chỉ cần triển khai hiện tại? Vì vậy, có vẻ như hiện tại, các thông điệp mạng bị hỏng hoặc các nút không ổn định có thể làm giảm hệ thống MPI. Giả sử cả hai yếu tố này đều bị xóa. Có lý do nào để không triển khai Hadoop bằng cách sử dụng MPI không? – artif
Tôi nghĩ đây là một câu trả lời hợp lý. –