Sự hiểu biết của tôi có đúng là công việc theo dõi khởi chạy nhiệm vụ (mapper/reducer) trên datanode nơi inputsplit được lưu trữ và chạy tác vụ trên phần dữ liệu và bản đồ lưu trữ đó là đầu ra trung gian trong bộ nhớ cục bộ của nó?Người lập bản đồ có lưu trữ các đầu ra trung gian của nó trên RAM của datanode mà nó đang chạy không?
vì vậy câu hỏi của tôi là: khi người lập bản đồ đang chạy trên datanode để lưu trữ dữ liệu trung gian của nó trên RAM của datanode? Và dưới dạng đĩa datanode là một phần của đầu ra hdfs và trung gian không được lưu trữ trên hdfs ..