Đây là những gì tôi thấy trên Web UI gần đâyChính xác những gì DFS không được sử dụng có nghĩa là gì?
Configured Capacity : 232.5 GB
DFS Used : 112.44 GB
Non DFS Used : 119.46 GB
DFS Remaining : 613.88 MB
DFS Used% : 48.36 %
DFS Remaining% : 0.26 %
và tôi rất bối rối mà không dfs sử dụng chiếm hơn một nửa công suất,
mà tôi nghĩ có nghĩa là một nửa dung lượng lưu trữ hadoop là bị lãng phí
Sau khi dành thời gian vô nghĩa để tìm kiếm, tôi chỉ định dạng nút tên và bắt đầu từ đầu.
Và sau đó tôi sao chép một tệp văn bản lớn (khoảng 19gigabyte) từ địa phương sang HDFS (đã thành công).
Bây giờ giao diện người dùng cho biết
Configured Capacity : 232.5 GB
DFS Used : 38.52 GB
Non DFS Used : 45.35 GB
DFS Remaining : 148.62 GB
DFS Used% : 16.57 %
DFS Remaining% : 63.92 %
trước khi sao chép, sử dụng và DFS Non DFS sử dụng đều 0.
Bởi vì DFS sử dụng là khoảng gấp đôi so với kích thước tập tin văn bản gốc và tôi cấu hình 2 bản sao,
Tôi đoán rằng DFS Được sử dụng bao gồm 2 bản gốc và meta.
Nhưng tôi vẫn không có bất kỳ ý tưởng nào về việc không sử dụng DFS từ đâu và tại sao lại chiếm quá nhiều vốn hơn DFS được sử dụng.
Điều gì sẽ xảy ra? Tôi đã làm sai?
Tôi có thể xóa dữ liệu không phải dfs không? Nếu có thì sao? – Mahesha999
@ Mahesha999: thử khởi động lại datanode. – kholis