Tài liệu về HBase nói rằng tránh tạo ra hơn 2-3 họ hàng cột vì HBase không xử lý nhiều hơn 2-3 nhóm cột rất tốt. Lý do cho điều này là nén và xả và do đó IO. Tuy nhiên, nếu tất cả các cột của tôi luôn được điền (cho mỗi hàng) thì tôi nghĩ lý do này không quan trọng, vì vậy, xem xét việc truy cập vào các cột là hoàn toàn ngẫu nhiên (tôi muốn truy cập bất kỳ tổ hợp cột nào) - tôi có thể có cột family -one cấu hình cột (có hiệu quả cố gắng để làm cho nó cột tinh khiết).Gia đình cột HBase
Có nhiều blog/wiki giải thích điều này nhưng tất cả đều có vẻ mâu thuẫn và thêm nhiều nhầm lẫn. Tôi chỉ không có vẻ để có thể tiêu hóa một thực tế rằng HBase thích một gia đình cột, sau đó những gì các điểm gọi là một cửa hàng cột?
Cảm ơn bạn đã giải thích! – PrakashT
Vì vậy, trong trường hợp của tôi, theo như tôi hiểu, tôi có hai lựa chọn: a) Tôi có tất cả các cột trong một họ cột. Điều này sẽ có tác động đến hiệu suất vì hầu hết thời gian tôi cần truy cập chỉ 1-2 cột nhưng với thiết kế này tôi sẽ đọc toàn bộ hàng. Mặc dù những lần đọc này sẽ được phân phối trên nhiều máy chủ khu vực. 2) Tôi chia các cột của tôi trong các gia đình sao cho chúng có kích thước tương tự nhau. – PrakashT
Bạn có lẽ nên ngừng lo lắng về việc đọc toàn bộ hàng. HBase cực kỳ tốt về việc chỉ đọc những gì nó thực sự cần. Nếu các tế bào mà bạn cần phải đọc là trong bộ nhớ, HBase sẽ không có thêm IO đĩa nào cả. –