2016-06-18 26 views
6

Tôi đã làm việc trên tổng hợp dữ liệu phát trực tuyến, tôi đã tìm thấy 2 công cụ để đạt được điều tương tự. Họ là druid và pipelinedb. Tôi đã hiểu việc thực hiện và kiến ​​trúc của cả hai. Nhưng không thể tìm ra cách để chuẩn bị cho cả hai. Có bất kỳ kiểm tra điểm chuẩn hiện có nào đã được thực hiện không? Hoặc nếu tôi muốn làm một điểm chuẩn của riêng tôi ngoài tốc độ và khả năng mở rộng thì tất cả những yếu tố mà tôi cần phải xem xét là gì. Bất kỳ ý tưởng, liên kết và trợ giúp nào sẽ thực sự đáng tin cậy. Cũng đừng chia sẻ kinh nghiệm của riêng bạn với pipelinedb và DruidSo sánh druid và pipelinedb

Cảm ơn

+1

Bạn có tìm thấy gì không? Tìm kiếm cùng một điều. Bạn đã làm gì cuối cùng và tại sao? –

Trả lời

0

UPD:

Sau khi đọc các trang PipelineDB, tôi chỉ tự hỏi tại sao bạn cần phải so sánh những thứ khác nhau như vậy?

Druid khá phức tạp để cài đặt và bảo trì, nó đòi hỏi một số phụ thuộc bên ngoài (chẳng hạn như zookeeper và hdfs/amazon, cũng phải được duy trì).

Và với mức giá đó bạn mua các tính năng chính của druid: theo định hướng cộtphân phối lưu trữ và xử lý. Điều đó cũng ngụ ý ngang theo chiều rộng out-of-the box, và nó là hoàn toàn tự động, bạn thậm chí không có suy nghĩ về nó.

Vì vậy, nếu bạn không cần bản chất phân tán của nó, tôi muốn nói rằng bạn không cần druid cả.

ĐẦU PHIÊN BẢN:

Tôi không có kinh nghiệm với pipelinedb (nó là gì google thấy không có gì, xin chia sẻ một số liên kết?), Nhưng tôi có nhiều kinh nghiệm với druid. Vì vậy, tôi sẽ xem xét (ngoài [truy vấn] tốc độ và khả năng mở rộng): (? Có bao nhiêu hàng mỗi giây/phút/giờ/... có thể được chèn)

  1. nuốt hiệu suất tiêu thụ
  2. RAM nuốt (cần bao nhiêu RAM để nhập bằng tốc độ mục tiêu?)
  3. mức nén (số lượng không gian đĩa cần giờ/ngày/tháng/... của dữ liệu?)
  4. lỗi-khoan dung (điều gì xảy ra khi một số của các thành phần không thành công? Nó là quan trọng cho doanh nghiệp của tôi?)
  5. Caching (chỉ cần lưu ý)
+0

bạn đang sử dụng Google nào? pipelinedb được tham chiếu khá tốt. https://www.pipelinedb.com/ – mathieu

+0

vừa hôm qua nó đã hiển thị rất nhiều trang "mua-tên miền này" –