2014-07-22 17 views
9

Tôi có cụm 4 datanodes và HDFS cấu trúc trên mỗi nút như sauthư mục/tmp trong hdoop hadoop là gì?

enter image description here

Tôi đang phải đối mặt với vấn đề không gian đĩa, như bạn sẽ nhìn thấy /tmp thư mục từ HDFS đã chiếm nhiều không gian hơn (217GB). Vì vậy, tôi đã cố gắng điều tra dữ liệu từ thư mục /tmp. Tôi tìm thấy các tập tin tạm thời sau. Tôi truy cập các thư mục tạm thời này, mỗi thư mục chứa một số tệp có kích thước từ 10 gb đến 20 gb. Tôi muốn xóa thư mục/tmp này. bất cứ ai có thể xin vui lòng cho tôi biết hậu quả của việc xóa các thư mục tmp hoặc một phần tập tin. Nó có ảnh hưởng đến cụm của tôi không?

enter image description here

Trả lời

14

HDFS/thư mục tmp chủ yếu được sử dụng như một lưu trữ tạm thời trong quá trình hoạt MapReduce. Các tạo tác Mapreduce, dữ liệu trung gian, v.v ... sẽ được lưu giữ trong thư mục này. Các tệp này sẽ tự động bị xóa khi thực thi lệnh mapreduce hoàn thành. Nếu bạn xóa các tệp tạm thời này, nó có thể ảnh hưởng đến các công việc đang tạo mapreduce đang chạy.

Tệp tạm thời được tạo bởi lợn. Xóa tệp tạm thời xảy ra ở cuối. Lợn không xử lý các tệp tạm thời nếu việc thực thi tập lệnh bị lỗi hoặc bị xóa. Sau đó, bạn phải xử lý tình huống này. Bạn xử lý tốt hơn các tệp tạm thời này làm sạch hoạt động trong tập lệnh.

bài viết sau đây sẽ cho bạn một sự hiểu biết tốt

http://www.lopakalogic.com/articles/hadoop-articles/pig-keeps-temp-files/

+0

Hi, Những/file thư mục tmp không bị xóa tự động. bạn có thể chia sẻ các tên tập tin mà chúng ta có thể thiết lập tùy chọn để xóa tự động các tập tin hay không. Và nếu các tập tin này là của các hoạt động mapreduce thì tại sao kích thước của/tmp là 217 Gb. –

+0

Bạn có thể đăng đầu ra của lệnh sau không? hadoop fs -lsr/tmp/temp-2050991966/tmp-184805992 – sachin

+0

'1) 2014-07-21 11:09/tmp/temp-2050991966/tmp-184805992/_SUCCESS 2) 2014-07-21 11: 07/tmp/temp-2050991966/tmp-184805992/_logs 3) 2014-07-21 11:09/tmp/temp-2050991966/tmp-184805992/_logs/history 4) 2014-07-21 11: 09 /tmp/temp-2050991966/tmp-184805992/_logs/history/job_201405161515_15124_1405921062606_ocuser_PigLatin%3AOC_Generate_Connect_Strength.pig 5) 278029 2014-07-21 11:07/tmp/temp-2050991966/tmp-184.805.992/_logs/lịch sử/job_201405161515_15124_conf .xml 6) 2014-07-21 11:08/tmp/temp-2050991966/tmp-184805992/part-m-00000 7) 2014-07 -21 11:08/tmp/temp-2050991966/tmp-184805992/part-m-00001' –

Các vấn đề liên quan