Có cách nào để kiểm soát tên tập tin đầu ra của một công việc Streaming Hadoop không? Cụ thể là tôi muốn nội dung và tên tệp đầu ra của công việc của tôi được sắp xếp theo đầu ra của bộ giảm tốc - mỗi tệp sẽ chỉ chứa các giá trị cho một khóa và tên của nó sẽ là khóa.Làm cách nào để kiểm soát tên tệp và nội dung của công việc phát trực tuyến Hadoop?
Cập nhật: Chỉ tìm thấy câu trả lời - Sử dụng lớp Java có nguồn gốc từ MultipleOutputFormat làm định dạng đầu ra công việc cho phép kiểm soát tên tệp đầu ra. http://hadoop.apache.org/core/docs/current/api/org/apache/hadoop/mapred/lib/MultipleOutputFormat.html
Tôi chưa thấy bất kỳ mẫu cho điều này ngoài kia ... bất cứ ai có thể chỉ ra một mẫu Hadoop streaming mà làm cho việc sử dụng một lớp Java định dạng đầu ra tùy chỉnh?
Liên kết bị hỏng đến tài liệu mới –