Hiện tại, tôi có một dòng cột cassandra với hàng lớn dữ liệu, để nói hơn 100.000. Bây giờ, tôi muốn xóa tất cả dữ liệu trong nhóm cột này và sự cố đã xuất hiện:Truy vấn tra cứu Cassandra khá chậm sau khi xóa gói dữ liệu lớn
Sau khi xóa tất cả dữ liệu, tôi thực hiện truy vấn tra cứu trong họ cột này, cassandra sẽ mất hàng chục giây để trả lại một kết quả truy vấn trống. Và chi phí thời gian sẽ tăng tuyến tính khi dữ liệu gốc lớn hơn
Nó do tính năng bia mộ trong khi xóa dữ liệu khỏi cơ sở dữ liệu cassandra. Tốc độ tra cứu sẽ không phục hồi bình thường cho đến khi GC tiếp theo được kích hoạt. Xem Cassandra Distributed Deletes.
Bởi vì các hoạt động truy vấn như vậy thường được sử dụng trong hệ thống của tôi, tôi không thể chịu độ trễ lớn đến vài giây.
Bạn vui lòng cho tôi giải pháp cho vấn đề này không?
Có thể sử dụng [model chuỗi thời gian] (https://academy.datastax.com/resources/getting-started-time-series-data-mode ling) có thể là một cách tiếp cận tốt? – deFreitas