Gần đây tôi đã gặp trường hợp Cassandra phù hợp để lưu trữ các sự kiện dựa trên thời gian với ttls tùy chỉnh cho mỗi loại sự kiện (giải pháp khác là lưu nó trong hadoop và tự động lưu sổ sách thủ công (ttls và nội dung) IMHO một ý tưởng rất phức tạp) hoặc chuyển sang HBase). Câu hỏi đặt ra là làm thế nào tốt các bản đồ cassandra MapReduce hỗ trợ hoạt động ra khỏi hộp mà không có phiên bản Datastax Enterprise.Cassandras Map Giảm hỗ trợ
Có vẻ như họ đầu tư rất nhiều vào CassandraFS nhưng tôi tự hỏi nếu Pig bình thường CassandraLoader được chủ động duy trì và thực sự cân (vì nó dường như không làm gì hơn là lặp qua các hàng trong lát). Điều này có hiệu quả với 100 trong số hàng triệu hàng không?
Đó là vì tôi đã sử dụng cassandra trong dự án và không thực sự muốn giới thiệu công nghệ mới ... – Tobias
Điểm tốt. Nếu việc xử lý tất cả dữ liệu mọi lúc mọi lúc - Điều này sẽ hiệu quả, nhưng nếu dữ liệu phát triển, tôi khuyên bạn nên xem xét lại để sử dụng thích nghi hơn cho việc lưu trữ tải bản đồ. – octo
Điều gì là vô nghĩa này? Nhiều (hầu hết?) Cụm Cassandra hỗ trợ hàng tỷ hàng khá tốt. Bạn đề cập đến sửa chữa nhưng đó là tất nhiên phân phối là tốt. – jbellis