Tôi nhận thấy rằng có hai bộ tham số cấu hình Hadoop: một tham số có bản đồ. * Và một với mapreduce. . Tôi đoán những điều này có thể là do API cũ so với API mới nhưng nếu tôi không nhầm lẫn, chúng dường như cùng tồn tại trong API mới. Tôi có đúng không? Nếu vậy, có một tuyên bố tổng quát những gì được sử dụng cho bản đồ. và điều gì dành cho mapreduce. *?Cấu hình Hadoop: mapred. * Vs mapreduce. *
Trả lời
Kiểm tra nguồn cho 0.20.2, chỉ có một vài mapreduce.*
tài sản, và họ xoay quanh việc cấu hình các lớp đầu vào công việc/định dạng đầu ra, mapper/bộ kết hợp/giảm tốc và phân vùng (họ cũng là dấu hiệu cho khách hàng công việc mà các API mới đang được sử dụng bởi người dùng - xem xét thông qua các nguồn cho o.a.h.mapreduce.Job
, setUseNewAPI()
phương pháp)
mapreduce.inputformat.class
mapreduce.outputformat.class
mapreduce.partitioner.class
mapreduce.map.class
mapreduce.combine.class
mapreduce.reduce.class
Có một số đặc tính hơn, nhưng họ là cấu hình phổ thông
Các đầu vào và đầu ra định dạng, cho dù đó là phiên bản API mới hay cũ, thường sử dụng mapred.*
tính
Ví dụ: tín hiệu bản đồ của bạn giảm đường dẫn nhập bạn sử dụng mapred.input.dir
(cho dù bạn là người Mỹ ng API mới hoặc cũ). Tương tự cho các tài sản đầu ra mapred.output.dir
Vì vậy, dài và ngắn nếu là, nếu không có một phương pháp hữu ích để cấu hình các tài sản (FileInputFormat.setInputPaths(Job, String)
) sau đó bạn sẽ cần phải kiểm tra nguồn
hadoop.mapred
không được dùng nữa.
Phiên bản trước 0.20.1
sử dụng mapred
. Phiên bản sau đó sử dụng mapreduce
.
Tôi không nghĩ rằng chúng cùng tồn tại.
Có mapred thư viện đã không được chấp nhận. thư viện Mapreduce mới trong hadoop 0.20.1 ..
Tuy nhiên, bạn vẫn có thể sử dụng một số tính năng được cung cấp bởi bản đồ, đó là lý do bạn vẫn tìm thấy nó trong thư mục.
Vui lòng xem liên kết này để biết bạn vẫn có thể sử dụng những tính năng nào: http://hadoop.apache.org/common/docs/r0.20.0/api/org/apache/hadoop/mapred/package-summary.html
- 1. Cấu hình JobConf v/s cho Hadoop 1.0.4
- 2. Bắt đầu với MapReduce/Hadoop
- 3. Hadoop MapReduce file nhiều Input
- 4. Hadoop MapReduce, câu hỏi triển khai Java
- 5. Cấu hình chậm hơn Hadoop
- 6. Ý tưởng dự án với Hadoop MapReduce
- 7. Hadoop: Lỗi trong cấu hình đối tượng
- 8. hadoop.mapred vs hadoop.mapreduce?
- 9. Chaining nhiều nhiệm vụ mapreduce trong Hadoop streaming
- 10. Định cấu hình nguồn dữ liệu ngoài cho Elastic MapReduce
- 11. Hadoop: OutputCollector hoạt động như thế nào trong MapReduce?
- 12. Hadoop MapReduce: Kích thước tệp đầu vào phù hợp?
- 13. Hadoop MapReduce - một tệp đầu ra cho mỗi đầu vào
- 14. Cấu hình Hadoop trên Windows thông qua Cygwin
- 15. gì là việc sử dụng các lớp cấu hình trong các chương trình Hadoop
- 16. Nguồn Hadoop MR: HDFS vs HBase. Lợi ích của mỗi?
- 17. Hadoop MapReduce cung cấp các thư mục lồng nhau như đầu vào công việc
- 18. Mapreduce for dummies
- 19. Các lựa chọn thay thế MapReduce
- 20. Thuật toán hệ số phân cụm cục bộ phân tán (MapReduce/Hadoop)
- 21. Riak thất bại trong các truy vấn MapReduce. Cấu hình nào sẽ sử dụng?
- 22. MapReduce và SQL GROUP BY
- 23. phương pháp thiết lập và dọn dẹp của Trình ánh xạ/Giảm tốc trong Hadoop MapReduce
- 24. Cách in trên bảng điều khiển trong khi thực hiện công việc MapReduce trong hadoop
- 25. Chạy Hadoop MapReduce, có thể gọi các tệp thi hành bên ngoài HDFS
- 26. Cần trợ giúp triển khai thuật toán này với bản đồ Hadoop MapReduce
- 27. Sắp xếp dữ liệu lớn bằng cách sử dụng MapReduce/Hadoop
- 28. Web API cho vs 2010 lắp đặt và cấu hình
- 29. Tạo cấu hình chạy thử trong VS 2008
- 30. Thiết lập thông số hadoop với boto?
Tôi đoán câu hỏi của tôi khá mơ hồ. Tôi không hỏi về thư viện. Tôi hỏi về hai tên tham số cấu hình hadoop khác nhau. – kee