Tôi cần phải viết một công việc MapReduce mà Gets tất cả các hàng trong một phạm vi ngày nhất định (nói cuối cùng một tháng). Nó đã là một lối đi chơi bánh có My Row Key bắt đầu với Date. Nhưng truy vấn Hbase thường xuyên của tôi là trên các giá trị bắt đầu của khóa.Làm thế nào để quét HBase hàng hiệu quả
Phím Hàng của tôi chính xác là A | B | C | 20120121 | D. Trường hợp kết hợp của A/B/C cùng với ngày (theo định dạng YearMonthDay) tạo một ID hàng duy nhất.
Bảng HBase của tôi có thể có tối đa vài triệu hàng. Mapper của tôi có nên đọc tất cả các bảng và lọc từng hàng nếu nó nằm trong phạm vi ngày nhất định hay Quét/Bộ lọc có thể giúp xử lý tình huống này không?
Ai đó có thể đề xuất (hoặc một đoạn mã) một cách để xử lý tình huống này một cách hiệu quả?
Cảm ơn -Panks
Tại sao bạn không sao chép nội dung của bảng sang bảng mới có khóa được sắp xếp lại và xóa phần cũ? – Mario
@Mario nếu bảng có một nghìn tỷ khóa thì sao? Và anh ta cần phải làm điều này thường xuyên? – markg