Cách tìm kích thước tệp HDFS? Lệnh nào nên được sử dụng để tìm kích thước của bất kỳ tệp nào trong HDFS.Cách tìm kích thước của tệp HDFS
Trả lời
Bạn có thể sử dụng lệnh hadoop fs -ls
để liệt kê các tệp trong thư mục hiện tại cũng như chi tiết của chúng. Cột thứ 5 trong đầu ra lệnh chứa kích thước tệp theo byte.
Ví dụ: lệnh hadoop fs -ls input
cung cấp kết quả sau:
Found 1 items
-rw-r--r-- 1 hduser supergroup 45956 2012-07-19 20:57 /user/hduser/input/sou
Kích thước tệp sou
là 45956 byte.
Tôi cũng thấy mình sử dụng hadoop fs -dus <path>
rất nhiều. Ví dụ, nếu một thư mục trên HDFS có tên là "/ user/frylock/input" chứa 100 tập tin và bạn cần có tổng kích thước cho tất cả những dữ liệu mà bạn có thể chạy:
hadoop fs -dus /user/frylock/input
và bạn sẽ nhận lại tổng kích thước (tính bằng byte) của tất cả các tệp trong thư mục "/ user/frylock/input".
Ngoài ra, hãy lưu ý rằng HDFS lưu trữ dữ liệu dư thừa để lưu trữ vật lý thực tế được sử dụng bởi một tệp có thể gấp 3 lần hoặc nhiều hơn số được báo cáo bởi hadoop fs -ls
và hadoop fs -dus
.
Ngoài điểm cuối cùng - yếu tố nhân rộng là số được hiển thị sau cờ quyền và trước chủ sở hữu (cột thứ 2 trong câu trả lời của @ adhunavkulkarni) –
hadoop fs -du -s
Sử dụng 'hadoop fs -du -s -h/user/frylock/input' để có đầu ra dễ đọc hơn nhiều. – axiom
Nếu bạn muốn thực hiện thông qua API, bạn có thể sử dụng phương thức 'getFileStatus()'.
Nó không đúng, nó không trả về kích thước tập tin nó trả về kích thước khối được phân bổ mà sẽ không bằng 0 cho các tệp rỗng. Mặc định là 67108864. – user1613360
Tôi đã sử dụng chức năng dưới đây đã giúp tôi nhận được kích thước tệp.
public class GetflStatus
{
public long getflSize(String args) throws IOException, FileNotFoundException
{
Configuration config = new Configuration();
Path path = new Path(args);
FileSystem hdfs = path.getFileSystem(config);
ContentSummary cSummary = hdfs.getContentSummary(path);
long length = cSummary.getLength();
return length;
}
}
Bạn có thể cho tôi biết nếu điều này trả về 7906 thì kích thước của thư mục đó là bao nhiêu? Là nó trong byte hoặc trong kbs? – retiremonk
Xem lệnh dưới đây với kịch bản awk để xem kích thước (trong GB) sản lượng lọc trong HDFS:
hadoop fs -du -s /data/ClientDataNew/**A*** | awk '{s+=$1} END {printf "%.3fGB\n", s/1000000000}'
đầu ra ---> 2.089GB
hadoop fs -du -s /data/ClientDataNew/**B*** | awk '{s+=$1} END {printf "%.3fG\n", s/1000000000}'
đầu ra ---> 1.724GB
hadoop fs -du -s /data/ClientDataNew/**C*** | awk '{s+=$1} END {printf "%.3fG\n", s/1000000000}'
đầu ra ---> 0.986GB
- 1. Kích thước khối Hadoop và vấn đề kích thước tệp?
- 2. Tìm tệp có kích thước trong Unix
- 3. Tìm kích thước của git repo
- 4. Tìm tệp trong Linux sau đó báo cáo kích thước của tệp được tìm kiếm
- 5. Cách lấy kích thước tệp
- 6. Cách tìm kích thước bộ đệm ổ cắm của linux
- 7. Cách tìm kích thước của một mảng trong postgresql
- 8. Cách tìm kích thước của dãy số nguyên
- 9. Cách ghi đè MeasureOverride để tìm kích thước của ItemsControl
- 10. Kích thước của tệp được tải lên
- 11. Cách tính kích thước tệp âm thanh?
- 12. Có cách nào để tìm hiểu kích thước/kích thước của các bảng cơ sở dữ liệu của bạn không?
- 13. đường dẫn tệp trong hdfs
- 14. Cập nhật tệp hadoop HDFS
- 15. Kích thước tệp tối đa của hình ảnh JPEG có kích thước đã biết
- 16. Thay đổi kích thước của ImageMagick PNG Tăng kích thước tệp
- 17. Nhận kích thước không nén của tệp .gz trong python
- 18. Kích thước tệp vỏ linux
- 19. Giảm kích thước tệp pdf
- 20. Kích thước của đối tượng tệp đang mở
- 21. Tìm kích thước dòng của mỗi hàng trong một tệp văn bản
- 22. Cách phát hiện kích thước của tệp bằng cách sử dụng API tệp và Dropzone.js
- 23. Làm cách nào để tìm chiều dài (hoặc kích thước, kích thước) của ma trận có khối u trong python?
- 24. Tìm kích thước của tệp đằng sau liên kết tải xuống với jQuery
- 25. NSFileManager - Kiểm tra kích thước tệp?
- 26. Giới thiệu về việc chia nhỏ tệp Hadoop/HDFS
- 27. gitignore theo kích thước tệp?
- 28. Giảm kích thước tệp SWF
- 29. tổng kích thước của nhóm tệp được chọn với 'find'
- 30. Kích thước của chuỗi
Bạn sẽ tạo kích thước như thế nào ở dạng có thể đọc được của con người? -ls - lah không hoạt động ở đây –