Tôi phải xem xét các giải pháp để cung cấp cơ sở dữ liệu MySQL có thể xử lý khối lượng dữ liệu trong phạm vi terabyte và có sẵn cao (năm nines). Mỗi hàng cơ sở dữ liệu có khả năng có dấu thời gian và tối đa 30 giá trị float. Khối lượng công việc dự kiến lên tới 2500 lần chèn/giây. Các truy vấn có thể ít thường xuyên hơn nhưng có thể lớn (có thể liên quan đến 100Gb dữ liệu) mặc dù có lẽ chỉ liên quan đến các bảng đơn.MySQL Cluster có thể xử lý một cơ sở dữ liệu terabyte
Tôi đã xem cụm MySQL được cung cấp đó là cung cấp HA của họ. Do khối lượng dữ liệu tôi cần phải sử dụng bộ nhớ dựa trên đĩa. Thực tế, tôi nghĩ rằng chỉ có các dấu thời gian có thể được giữ trong bộ nhớ và tất cả các dữ liệu khác sẽ cần phải được lưu trữ trên đĩa.
Có ai có kinh nghiệm sử dụng MySQL Cluster trên cơ sở dữ liệu có quy mô này không? Nó có khả thi không? Dung lượng lưu trữ trên đĩa ảnh hưởng như thế nào đến hiệu suất?
Tôi cũng mở cho các đề xuất khác về cách đạt được tính khả dụng mong muốn cho khối lượng dữ liệu này. Ví dụ, sẽ tốt hơn nếu sử dụng một thư viện của bên thứ ba như Sequoia để xử lý việc phân cụm các cá thể MySQL chuẩn? Hoặc một giải pháp chuyển tiếp thẳng dựa trên nhân rộng MySQL?
Điều kiện duy nhất là nó phải là giải pháp dựa trên MySQL. Tôi không nghĩ rằng MySQL là cách tốt nhất để đi cho các dữ liệu chúng tôi đang đối phó với nhưng nó là một yêu cầu khó khăn.
Nếu bạn đang mua sắm công nghệ, bạn có thể xem xét một số dự án dựa trên BigTable của Google. HBase từ Hadoop và Hypertable là những dự án thú vị để xem xét. http://hadoop.apache.org/hbase/ và http://www.hypertable.org/ – Kekoa
Câu hỏi đó có thể được yêu cầu tốt hơn trên serverfault.com. – lothar