Tôi muốn tệp đầu ra có định dạng là 2012117-part-r-00000. Về cơ bản tôi muốn các tập tin đầu ra có ngày nối thêm vào nó, để tôi có thể sắp xếp các tập tin theo ngày. Tôi đã xem OutputFormat và FileOutputFormat, nhưng nó không giúp ích cho trường hợp của tôi.cách đặt tên tùy chỉnh cho các tệp đầu ra hadoop
Trả lời
Tôi vừa phát hiện ra cho các API mới, tôi có thể sử dụng org.apache.hadoop.mapreduce.lib.output.MultipleOutputs và phương pháp addNamedOutput()
Không có nhiều sự linh hoạt trong tên tệp đầu ra của công việc MR. Sử dụng các lớp con của MultipleOutputFormat.
Phương pháp MultipleOutputFormat#generateFileNameForKeyValue phải được triển khai, bỏ qua các đầu vào cho phương thức này và trả về một chuỗi trong mẫu date + -part-r- + mapred.task.partition
. mapred.task.partition là một int, do đó, nó phải được đệm sẵn với 0 một cách thích hợp.
LÀ không có cách nào dễ dàng, tại một trong những phiên bản trước đó tôi đoán chúng tôi đã có tùy chọn như FileOutputFormat.setOutputName (JobConf công việc, Tên chuỗi); Ngoài ra, lớp giảm tốc của tôi đã được mở rộng Reducer, vì vậy nó sẽ được tought cho tôi để mở rộng một lớp học. – RFT
Tôi không thấy điều đó trong API Hadoop. –
Ok, nhưng như tôi đã đề cập đến lớp giảm tốc của tôi đã mở rộng một lớp khác, tôi có thể bao gồm một lớp tĩnh và có lớp đó mở rộng MultipleOutputFormat và sau đó gọi lớp đó từ đâu đó? – RFT
- 1. Hadoop MapReduce - một tệp đầu ra cho mỗi đầu vào
- 2. Tạo các tệp đầu ra riêng biệt trong Hadoop Streaming
- 3. Tùy chỉnh các trường đầu ra elmah.axd
- 4. Asp.net Web API - Cách đặt tên tệp cho Định dạng Kiểu phương tiện CSV tùy chỉnh
- 5. Logback - đầu ra tùy chỉnh cho ngoại lệ
- 6. Nhận tên tệp đầu vào trong chương trình hadoop tuyến
- 7. Tên tệp đầu ra xsd.exe
- 8. C++ luồng đầu ra tùy chỉnh với thụt đầu dòng
- 9. Ghi nhật ký Java - cách chuyển hướng đầu ra sang tệp nhật ký tùy chỉnh cho trình ghi nhật ký?
- 10. Hadoop - nút tên không bắt đầu lên
- 11. .Net Tên tệp theo dõi tùy chỉnh
- 12. Hadoop trong đổi tên tệp
- 13. Quy ước đặt tên cho các tệp lớp một phần
- 14. Làm cách nào để tùy chỉnh đầu ra của Jenkins?
- 15. Làm cách nào để tùy chỉnh đầu ra của loại tùy chỉnh bằng printf?
- 16. Áp dụng các bộ lọc tùy chỉnh cho đầu ra máy ảnh
- 17. Đặt tên tùy chỉnh Proguard cho các lớp học, thành viên và tham số obfuscation
- 18. Cách đặt JAXBContext tùy chỉnh
- 19. Cách tùy chỉnh lớp có thể ghi trong Hadoop?
- 20. Tên tệp đầu ra trong Flash Builder
- 21. Nối tiếp thành XML qua DataContract: đầu ra tùy chỉnh?
- 22. Tên tùy chỉnh Django syncdb cho bảng
- 23. Làm thế nào để tùy chỉnh đầu ra Zend_Tool?
- 24. sử dụng tên testcase trong tên tệp đầu ra
- 25. Bật Intellisense cho mục tùy chỉnh trong các tệp .config
- 26. Có thể tùy chỉnh Đầu ra NUnit XML
- 27. Tùy chỉnh đầu ra định dạng của .sass?
- 28. Tùy chỉnh đầu ra Trợ giúp WebHttp trong WCF
- 29. Đổi tên đầu ra của CPack
- 30. Cách lấy tên tệp đầu vào trong trình ánh xạ trong chương trình Hadoop?
là nó có thể đổi tên các tập tin đầu ra của Sqoop? –