Tôi có chương trình "chỉ bản đồ" (không giảm giai đoạn). Kích thước của tệp đầu vào đủ lớn để tạo 7 tác vụ bản đồ và tôi đã xác minh rằng bằng cách tìm đầu ra được tạo ra (part-000 to part006). Bây giờ, cụm của tôi có 8 nút mỗi với 8 lõi và 8 GB bộ nhớ và hệ thống tập tin được chia sẻ được lưu trữ tại nút đầu.Làm thế nào để lên lịch cho các tác vụ Bản đồ Hadoop trong cụm nút đa lõi 8?
Câu hỏi của tôi là tôi có thể chọn giữa chạy tất cả 7 tác vụ bản đồ trong 1 nút hoặc chạy 7 tác vụ bản đồ trong 7 nút nô lệ khác nhau (1 nhiệm vụ cho mỗi nút). Nếu tôi có thể làm như vậy, thì những gì thay đổi trong mã của tôi và tập tin cấu hình là cần thiết.
Tôi đã thử đặt tham số "mapred.tasktracker.map.tasks.maximum" thành 1 và 7 trong mã của mình nhưng tôi không tìm thấy bất kỳ chênh lệch thời gian đáng kể nào. Trong tệp cấu hình của tôi, nó được đặt thành 1.