2010-01-23 42 views
20

Tôi đang tìm một cửa hàng dữ liệu cuối cùng nhất quán và có vẻ như nó có thể sẽ đến với Riak hoặc Cassandra. Có ai đã nhận được expereince của một cái nhìn về điều này?Cassandra vs Riak

Trả lời

33

Như bạn có thể đã biết, chúng đều bị ảnh hưởng mạnh về mặt kiến ​​trúc bởi Dynamo (cuối cùng nhất quán, không có điểm lỗi nào, vv). Cả hai cũng đi xa hơn Dynamo trong việc cung cấp một mô hình dữ liệu “giàu hơn thuần túy K/V” - trong trường hợp của Cassandra, cung cấp một chế độ ColumnFamily giống như Bigtable, ở Riak, một định hướng tài liệu. Tôi đã thấy những người lành mạnh chọn cả hai.

Tôi tin rằng điểm có lợi cho Cassandra bao gồm

điểm có lợi cho Riak bao gồm

  • bản đồ/giảm hỗ trợ ra khỏi hộp

/Cassandra dev, fwiw

+1

Vâng, tôi vẫn trên hàng rào về việc này. Vấn đề lớn nhất tôi có cho đến nay với Riak là thiếu tài liệu, vì nó nghe hoàn hảo trên giấy. Có một cộng đồng lớn xung quanh Cassandra theo ý kiến ​​của bạn không? – Zubair

+0

Ngoài ra dường như không có bất kỳ triển khai lớn nào của Riak. – Zubair

+0

Cộng đồng Cassandra là tuyệt vời; kênh IRC thường đạt đỉnh điểm với hơn 110 người mỗi ngày và việc tham gia danh sách gửi thư cũng tốt. – jbellis

12

Riak được sử dụng bởi

  • Mozilla Foundation
  • Ask.com danh sách tài trợ
  • Comcast
  • Citigroup
  • Bet365

Tôi nghĩ rằng cả hai đều vượt qua thử nghiệm của khách hàng/người dùng tham khảo đáng tin cậy.

Cassandra có vẻ trưởng thành hơn và hiện đang hoạt động tốt hơn trong điểm chuẩn. Riak có vẻ dễ dàng hơn để thêm một nút vào khi cụm của bạn phát triển.

1

Sử dụng và tải xuống khác nhau. Tốt nhất để có được tài liệu tham khảo.

Có lẽ một cuộc trò chuyện riêng tư có thể có nơi Riak tham khảo trong các công ty này có thể được chia sẻ? Không chắc chắn làm thế nào để có được như vậy với Cassandra, nhưng có một cộng đồng của các công ty có hỗ trợ Cassandra mà dường như là một nơi tốt để bắt đầu. Vì đây có lẽ là những người tham gia cộng đồng trong việc phát triển Cassandra, nên đây có thể là một nơi thực sự hợp lý để bắt đầu.

Tôi muốn nghe câu trả lời của Riak về các triển khai gần đây và lớn, nơi khách hàng hài lòng.

Tôi cũng muốn xem lộ trình cho mỗi sản phẩm. Cassandra dễ theo dõi hơn (http://wiki.apache.org/cassandra/) hơn là Riak theo quan điểm của tôi vì wiki của Cassandra thảo luận về những hạn chế và những thứ có thể sẽ thay đổi trong tương lai, nhưng cũng không thể phác thảo tương lai tốt. Tôi có thể hiểu rằng một cộng đồng nguồn mở ... có lẽ ... nhưng tôi không thể cho một sản phẩm mà tôi phải trả.

1

Tôi cũng sẽ đề xuất nghiên cứu về Cloudant, điều có vẻ là một lớp khả năng rất đẹp. Nó cũng giống như nó mang đến khả năng ở những nơi khác trong vùng đất Apache.CouchDB là nền tảng Apache dựa trên nền tảng của Cloudant. NHƯNG việc lập chỉ mục với Lucene dường như là đỉnh của tảng băng khi nói đến nơi Cloudant có thể đi. Tạo và quản lý chỉ mục là một quá trình rất có hệ thống, một loại đường dẫn dữ liệu, có thể được viết kịch bản bằng các tài sản cộng đồng Apache khác. Và các khả năng như NLP cũng có thể được thêm vào thông qua Lucene gián tiếp, hoặc có thể trực tiếp vào những gì được duy trì.

Thật tuyệt khi thấy lộ trình Cloudant được đề xuất, đặc biệt là khi nhóm nghiên cứu có thể khai thác những người giàu có của cộng đồng Apache và tích hợp vào Cloudant. Điều này có thể tồn tại vì có một thành phần hoạt động với mô hình doanh thu Cloudant sẽ yêu cầu nó, nếu không có lý do nào khác.

Một lĩnh vực đáng chú ý khác ... Mô hình định giá của Cloudant ... rõ ràng mô hình doanh thu của họ không dựa trên phần mềm, nhưng xung quanh dịch vụ. Điều đó khá hấp dẫn và có vẻ như phù hợp với hệ sinh thái xung quanh Cassandra. Tôi không biết liệu những người Basho đã giành được quá đủ cộng đồng nosql chưa ... không thấy bất kỳ điều gì xung quanh trang web hoặc sản phẩm của họ.

Tôi thích trang web Cloudant này (https://cloudant.com/the-data-layer/). Tôi đã rất ngạc nhiên khi thấy khả năng nhúng Erlang ... Tôi không biết CouchDB được viết bằng Erlang vì điều này có vẻ bất thường đối với tôi trong cộng đồng Apache (sự thiếu hiểu biết của tôi); CouchDB dường như cũ hơn các sản phẩm nosql khác mà tôi biết (nay) được viết bằng Erlang. Bất kể chiến lược của họ, họ ít nhất là đếm Amazon EC2 và Microsoft Azure là đối tác lưu trữ, cho thấy sự đánh giá cao của Microsoft và thế giới Microsoft - tất cả đều rất quan trọng nếu nhận ra đúng giá trị phần mềm trung gian (ngoài bộ nhớ cache hoặc ứng dụng bảng băm). cửa hàng có thể có.

Cuối cùng, trong khi tôi không biết rõ về hội đồng quản trị, hướng dẫn của Andy Palmer có vẻ như nó sẽ có giá trị. Ông có thể mang lại một số hướng dẫn dữ liệu có cấu trúc vis-a-vis (thông qua VoltDB) cho một thế giới mà đúng hay sai có thể không được thương hiệu như là các bảng băm KVP của dữ liệu phi cấu trúc. Nhu cầu về cấu trúc và hệ sinh thái xung quanh cơ sở dữ liệu "nosql" đang được công nhận ... chứng kiến ​​nỗ lực của Google với Spanner ... KVP/cấu trúc nhỏ/cần cho khả năng tìm kiếm thúc đẩy đầu tư của Google vào không gian Spanner. Mặc dù tất cả chúng ta có thể không cần Spanner, nhưng chúng ta có thể cần một khả năng tương tác và quản lý "doanh nghiệp" mạnh mẽ trong các cơ sở dữ liệu nosql này để làm cho nó hợp lý để kết hợp chúng thành các kiến ​​trúc đám mây hiện đại. Cấu trúc cần thiết có thể đến từ tính dễ thao tác và khả năng hoạt động đa dạng. Nó cũng có thể đến từ các khả năng mới hỗ trợ chuyển đổi dữ liệu phi cấu trúc thành dữ liệu có cấu trúc (ví dụ: chỉ mục, sử dụng NLP để tạo các kết xuất có cấu trúc và phân tích cú pháp của những thứ bên trong một đốm màu KVP, và nhiều thứ khác được xuất bản, có thể lôi kéo và phát triển cơ sở người dùng). Cloudant trông giống như nó có một cơ hội tốt để thành công ... Tôi sẽ có một cái nhìn sâu hơn về nó ...

Và hãy nhìn những gì tôi thấy về CouchDB ...

CouchDB đi kèm với một bộ tính năng, chẳng hạn như chuyển đổi tài liệu trực tuyến và thông báo thay đổi theo thời gian thực, điều đó làm cho việc phát triển ứng dụng web trở nên dễ dàng. Nó thậm chí còn đi kèm với giao diện quản trị web dễ sử dụng. Bạn đoán nó, phục vụ trực tiếp ra khỏi CouchDB! Chúng tôi quan tâm rất nhiều đến việc chia tỷ lệ phân phối. CouchDB là rất có sẵn và phân vùng khoan dung, nhưng cuối cùng cũng phù hợp. Và chúng tôi quan tâm rất nhiều đến dữ liệu của bạn. CouchDB có một công cụ lưu trữ có khả năng chịu lỗi giúp bảo mật dữ liệu của bạn trước tiên.

+1

Riak cũng được viết bằng erlang https://github.com/basho/riak – Mainguy