Tôi có thể tìm thấy tên nếu tệp đầu vào trong một lớp bản đồ bằng cách sử dụng FileSplit khi viết chương trình bằng Java.Nhận tên tệp đầu vào trong chương trình hadoop tuyến
Có cách nào tương ứng để thực hiện điều này khi tôi viết một chương trình bằng Python (sử dụng trực tuyến?)
Tôi tìm thấy sau đây trong tài liệu trực tuyến hadoop trên apache:
Xem cấu hình tham số. Trong quá trình thực hiện lệnh truyền trực tuyến, tên của tham số "được sắp xếp bản đồ" được chuyển đổi. Các dấu chấm (.) trở thành dấu gạch dưới (_). Ví dụ: mapred.job.id trở thành mapred_job_id và mapred.jar trở thành mapred_jar. Trong mã của bạn, hãy sử dụng tên thông số có dấu gạch dưới.
Nhưng tôi vẫn không thể hiểu cách sử dụng điều này bên trong công cụ lập bản đồ của mình.
Mọi trợ giúp đều được đánh giá cao.
Cảm ơn
Có vẻ như thuộc tính Krishnamutry cần được gọi là "map.input.file" - có khả năng sẽ xuất hiện dưới dạng biến môi trường "map_input_file" cho công việc phát trực tuyến. –
Lưu ý: các khoảng thời gian phải được thay thế bằng dấu gạch dưới –
Cảm ơn - đã cập nhật nó. –