Chúng tôi đang xây dựng một hệ thống đo lường mà cuối cùng sẽ bao gồm hàng nghìn trạm đo lường. Mỗi trạm sẽ tiết kiệm khoảng 500 triệu phép đo bao gồm 30 giá trị vô hướng trong suốt vòng đời của nó. Đây sẽ là giá trị nổi. Chúng tôi hiện đang tự hỏi cách lưu dữ liệu này trên mỗi trạm, xem xét chúng tôi sẽ xây dựng một ứng dụng web trên mỗi trạm sao chocơ sở dữ liệu tốt (noSQL?) Cho các phép đo vật lý
- chúng tôi muốn hình ảnh hóa dữ liệu trên nhiều lần (ví dụ: đo một tuần, tháng, năm)
- chúng ta cần phải xây dựng các đường trung bình so với các dữ liệu (ví dụ trung bình trong một tháng để hiển thị trong một đồ thị năm)
- cơ sở dữ liệu cần phải được kháng (cúp điện sụp đổ)
- chúng tôi chỉ làm viết và đọc, không có cập nhật hoặc xóa trên dữ liệu
ngoài ra, chúng tôi muốn có thêm một máy chủ có thể hiển thị dữ liệu của 1000 trạm đo lường. Đó sẽ là ~ 50TB dữ liệu trong 500 tỷ phép đo. Để truyền dữ liệu từ trạm đo đến máy chủ, tôi nghĩ rằng một số loại sao chép ở cấp cơ sở dữ liệu sẽ là một cách sạch sẽ và hiệu quả.
Bây giờ tôi tự hỏi nếu một giải pháp noSQL có thể tốt hơn so với mySQL cho các mục đích này. Đặc biệt là couchDB, Cassandra và có thể là các cửa hàng có giá trị quan trọng như Redis trông hấp dẫn đối với tôi. Cái nào trong số đó phù hợp với mô hình dữ liệu "chuỗi thời gian đo lường" tốt nhất theo ý kiến của bạn? Còn những ưu điểm khác như an toàn va chạm và sao chép từ trạm đo đến máy chủ chính thì sao?
Tôi cũng đã tìm thấy NetCDF - bất kỳ ai có kinh nghiệm với ứng dụng này? Nó được tạo cho chuỗi thời gian, nhưng tôi không chắc chắn về khả năng chống va chạm và mở rộng quy mô sử dụng nhiều máy chủ ... – Chris