Lưu ý, tôi biết đây là một câu hỏi cũ, tôi chỉ muốn cân bằng một số quan niệm sai lầm về chi phí khi tôi đang làm điều này ngay bây giờ như là một thử nghiệm.Không giống như những gì DavidB nghĩ, nó không tốn hàng triệu - ngay cả khi bạn chạy phần cứng lưu trữ chuyên dụng, bạn có thể dễ dàng dưới một vài nghìn/tháng (BTDT, một trong những khách hàng của tôi đang chạy một cụm 8 nút cho khoảng 800 đô la/tháng). Điều đó nói rằng, đó là một nhức đầu bảo trì bạn muốn tránh, và Cassandra trên EC2 là dễ dàng hơn để đối phó với.
Bạn có thể dễ dàng chạy một đám mây sản xuất đáng kể trên EC2 với giá dưới $ 1000/tháng và bạn có thể làm R & D đám mây với giá dưới $ 100/tháng (tôi chi khoảng $ 52 vào tháng trước cho một cụm thử nghiệm 10 máy). Tôi khuyên bạn nên sử dụng TurnKey Linux để quản lý việc cung cấp & trang trại R & D của bạn, vì công cụ của họ sẽ cho phép bạn di chuyển các phiên bản từ máy tính để bàn sang bất kỳ nền tảng lưu trữ ảo nào trong vài phút (và ngược lại). Thêm vào đó họ có tích hợp thực sự trơn tru với EC2.
Đối với mức độ thực sự nghiêm trọng của giao thông, Pintrest một lần nói rằng họ chi tiêu $ 15 đến $ 50/giờ tùy thuộc vào tải máy chủ, tự động mở rộng quy mô để đáp ứng nhu cầu giao thông, xem http://www.theregister.co.uk/2012/04/30/inside_pinterest_virtual_data_center/ để biết chi tiết
Chi phí thực sự là trong thiết lập và quản lý của cá thể Cassandra được phân phối của bạn. May mắn thay, NetFlix vừa phát hành một tấn công cụ quản lý chỉ cho việc này. Bạn có thể tìm thấy chúng ở đây: https://github.com/netflix - cũng có rất nhiều video thú vị về việc sử dụng AWS của NetFlix, đặc biệt là di chuyển nội dung từ Cassandra sang S3 - xem blog của họ tại đây http://techblog.netflix.com/2012/12/videos-of-netflix-talks-at-aws-reinvent.html
Cassandra sẽ hoạt động. Bạn cũng có thể muốn xem xét các giải pháp lưu trữ tệp phân tán như MogileFS, HDFS, v.v. – DougW