Trong Hadoop, bạn có thể sử dụng cơ chế sắp xếp thứ cấp để sắp xếp các giá trị trước khi chúng được gửi đến bộ giảm tốc.Lớp khóa nào phù hợp để sắp xếp thứ cấp?
Cách này được thực hiện trong Hadoop là bạn thêm giá trị để sắp xếp theo khóa và sau đó có một số phương thức so sánh nhóm và khóa tùy chỉnh móc vào hệ thống sắp xếp.
Vì vậy, bạn sẽ cần có khóa bao gồm chủ yếu cả khóa thực và giá trị cần sắp xếp theo. Để thực hiện điều này đủ nhanh, tôi sẽ cần một cách tạo khóa tổng hợp cũng dễ dàng phân hủy thành các phần riêng biệt cần thiết cho nhóm và các phương pháp so sánh chính.
Cách thông minh nhất là làm điều này. Có một lớp Hadoop "ngoài hộp" có thể hỗ trợ tôi trong việc này hay tôi phải tạo một lớp khóa riêng cho từng bước giảm bản đồ?
Làm cách nào để thực hiện điều này nếu khóa thực sự là một tổng hợp bao gồm nhiều phần (cũng cần thiết riêng biệt vì trình phân vùng)?
Các bạn đề xuất điều gì?
P.S. Tôi muốn thêm thẻ "phân loại phụ" nhưng tôi không có đủ đại diện để làm như vậy.
ở đó bạn đi (tôi đã thêm thẻ) :-) –
Cảm ơn bạn đã thêm thẻ :) –
Bạn chưa nhận được câu hỏi của mình, bạn có muốn thêm một ví dụ ngắn không? – Sudarshan