Tôi đang làm việc để thiết lập một cụm hadoop nơi các nút tất cả đều không đồng nhất, nghĩa là mỗi nút có một số lõi khác nhau. Hiện nay tôi phải tự chỉnh sửa các mapred-site.xml
trên mỗi nút để điền vào {cores}
:Tự động đặt số lượng tác vụ bản đồ tối đa trên mỗi nút cho số lượng lõi?
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>{cores}</value>
</property>
Có một cách dễ dàng hơn để đến đây khi tôi thêm các nút mới? Hầu hết các giá trị khác là một số mặc định và các tác vụ bản đồ tối đa là điều duy nhất thay đổi từ nút này sang nút khác.
Cảm ơn. Tôi biết tôi có thể chạy một số loại kịch bản để làm điều đó, nhưng tôi đã hy vọng cho một số loại biến hadoop mà tôi có thể thả vào. Hoặc ít nhất là một mặc định hợp lý hơn 2. – job
Bạn có thể sửa đổi mã nguồn TaskTracker để giải thích một công thức trong mapred-site.xml (ví dụ '$ CORES/2-1') - nhưng tốt nhất bạn cũng cần phải tìm một cách Java để xác định số lõi. –