Trong bộ đếm công việc hadoop, sự khác biệt giữa "Bản đồ đầu ra byte vật liệu" so với "byte đầu ra bản đồ" là gì? Tôi không nhìn thấy trước khi tôi vô hiệu hóa nén đầu ra bản đồ vì vậy tôi đoán nó là byte đầu ra thực (nén) trong khi sau này là byte không nén?"Bản đồ đầu ra byte vật liệu" so với "byte đầu ra bản đồ"
Trả lời
Tôi nghĩ bạn đúng. Từ http://hadoop.apache.org/docs/r1.0.4/releasenotes.html:
MAPREDUCE-2365. Các bộ đếm mới cho FileInputFormat (BYTES_READ) và FileOutputFormat (BYTES_WRITTEN). Bộ đếm mới MAP_OUTPUT_MATERIALIZED_BYTES cho MapOutputSize được nén. (Siddharth Seth)
(Thay đổi từ Hadoop 0.20.2)
.............................. .................................................. .................................................. .................
Dưới đây là một trích dẫn từ Tom White "Hadoop Definitive Guide", 3rd edition (bảng 8-2, trang 261):
"Bản đồ đầu ra vật liệu byte" - Số byte của bản đồ đầu ra thực sự được ghi vào đĩa. Nếu nén đầu ra bản đồ được bật, điều này được phản ánh trong giá trị bộ đếm.
"byte đầu ra bản đồ" - Số byte đầu ra không nén được tạo bởi tất cả bản đồ trong công việc. Được tăng lên mỗi khi phương pháp collect()
được gọi trên OutputCollector
của bản đồ.
- 1. Bản đồ HadoopBắt đầu ra trung gian
- 2. "Bắt đầu từ đầu ra bản đồ" mất rất nhiều thời gian trong tác vụ bản đồ hadoop
- 3. Làm cách nào để tạo ra bản đồ bản đồ?
- 4. cách tạo biểu đồ đầu ra jmeter
- 5. NUL-byte giữa mỗi ký tự khác trong đầu ra
- 6. bản đồ so với hành vi của bản đồ
- 7. Lập bản đồ kết cấu động gây ra lỗi "Đã lập bản đồ"
- 8. Bản đồ Mongo Giảm lần đầu tiên
- 9. Công cụ Valgrind Massif đầu ra giao diện đồ họa?
- 10. thuật toán Hash trong C để lập bản đồ 16 byte-giá trị đến 2 byte-giá trị
- 11. Bắt đầu bit và bắt đầu Byte
- 12. Clojure áp dụng so với bản đồ
- 13. Một công việc Mapreduce với đầu vào văn bản đơn giản và đầu ra avro
- 14. In phiên bản Python ở đầu ra
- 15. Giải thích bản thân -S đầu ra
- 16. String và lập bản đồ nhân vật câu hỏi cho ra của guru có
- 17. Trích xuất gói dữ liệu ra khỏi bộ đệm byte
- 18. Sử dụng lệnh Grep Linux - cần đầu ra cho tệp văn bản, đầu ra sạch hơn
- 19. Bản đồ giao dịch với Bản đồ đồng bộ
- 20. Bản đồ cấu trúc dữ liệu Bản đồ
- 21. Bản đồ bản đồ - cách giữ bản đồ bên trong làm bản đồ?
- 22. Xóa 16 byte đầu tiên?
- 23. PostScript so với PDF dưới dạng định dạng đầu ra
- 24. Bản đồ JQuery vs bản đồ Javascript so với Vòng lặp
- 25. Bản đồ + bản đồ choropleth trong R
- 26. Bản đồ bộ nhớ hiển thị nhiều RAM hơn so với vật lý có sẵn
- 27. Xóa 16 byte đầu tiên khỏi mảng byte
- 28. Đầu ra văn bản trung tâm từ Graphics.DrawString()
- 29. bản đồ golang in ra theo thứ tự
- 30. Tuyến đường luôn đi tới bản đồ đầu tiên
Tôi dường như không thấy "Bản đồ xuất các byte được materialized hóa" trong trang chi tiết công việc của tôi. Tôi đang sử dụng Hadoop 2.0.0-mr1-cdh4.2.1. Tôi có phải thực hiện một số thay đổi thiết lập không. –