2013-06-24 32 views
60

Có ai vui lòng cung cấp hoặc chỉ ra sự so sánh tốt giữa Neo4j và Titan không? Một điều tôi có thể thấy là về quy mô - Titan là quy mô và yêu cầu một kho dữ liệu có khả năng mở rộng cơ bản như cassandra. Neo4j chỉ dành cho HA và có cơ sở dữ liệu nhúng riêng của nó. Bất kỳ ưu và khuyết điểm nào khác? Bất kỳ giai đoạn cụ thể nào. (Có phải Titan đang được sử dụng ở bất kỳ nơi nào không?)ai đã thử neo4j vs titan - ưu và khuyết điểm

Tôi cũng có liên kết sau: http://architects.dzone.com/articles/16-graph-databases-compared cho phép so sánh khách quan với cơ sở dữ liệu đồ thị nhưng không có nhiều ưu điểm và nhược điểm giữa Neo4j và Titan.

+0

Bạn có thể xem @ [Titan vs Neo4j] (https://groups.google.com/d/msg/aureliusgraphs/vkQkzjN8fo0/9YYgqI4TA0QJ), nó có thể giúp bạn .. –

Trả lời

16

Thật tuyệt khi thấy bạn khám phá cơ sở dữ liệu biểu đồ. Tôi sẽ nói với phần Neo4j về câu hỏi của bạn:

Hơn 30 trong số 2000 hiện tại toàn cầu sử dụng Neo4j trong sản xuất cho nhiều trường hợp sử dụng, nhiều trường hợp đáng ngạc nhiên, ngay cả đối với chúng tôi! (Và chúng tôi đã phát minh ra đồ thị bất động sản!)

Một phần danh sách các khách hàng có thể tìm thấy dưới đây: www.neotechnology.com/customers

Neo4j đã được sản xuất 24x7 trong 10 năm, và trong khi các sản phẩm có tất nhiên phát triển đáng kể kể từ đó , nó được xây dựng trên nền tảng rất chắc chắn.

Hầu hết các công ty chuyển sang cơ sở dữ liệu đồ thị - nói cho Neo4j, đó là những gì tôi biết-- đang làm như vậy bởi vì a) RDBMS của họ không thể xử lý phạm vi yêu cầu truy vấn được kết nối của họ theo phạm vi & và/hoặc b) sự thuận tiện và tốc độ to lớn đến từ việc mô hình hóa các miền là biểu đồ (mạng xã hội, mạng & quản lý trung tâm dữ liệu, gian lận, danh mục đầu tư, danh tính, v.v.) dưới dạng biểu đồ chứ không phải dưới dạng bảng.

Đối với đá, bạn có thể tìm thấy một số cuộc đàm phán khách hàng ở đây, từ bốn (sớm lăm) hội nghị GraphConnect đó đã được tổ chức trong năm nay tại các thành phố lớn trên thế giới:

http://watch.neo4j.org/

Nếu bạn' tại Luân Đôn, người cuối cùng sẽ được tổ chức vào tuần tới: http://www.graphconnect.com

Bạn sẽ tìm thấy bản tóm tắt bên dưới một số công nghệ đằng sau Neo4j, với một số ví dụ của khách hàng. Để nói rất trực tiếp với câu hỏi của bạn về mở rộng quy mô: Neo4j có kiến ​​trúc độc đáo được thiết kế để tối đa hóa thời gian phản hồi truy vấn & khả năng dự đoán truy vấn, bằng cách cho phép mở rộng theo chiều ngang sao cho mỗi trường hợp có thể truy cập biểu đồ mà không cần phải nhảy qua mạng. Nó chỉ ra rằng cách tiếp cận này hoạt động tốt cho 95 +% các đồ thị trên mạng, bao gồm một số khách hàng sản xuất có hơn một nửa biểu đồ xã hội Facebook đang chạy trong một cụm Neo4j duy nhất, sao lưu trang web 24x7 "luôn bật".

www.neotechnology.com/neo4j-scales-for-the-enterprise/

Một trong những dịch vụ chuyển phát bưu chính lớn nhất thế giới hiện tất cả các gói thời gian thực của họ định tuyến với Neo4j. Đường sắt đang xây dựng hệ thống định tuyến trên Neo4j. Một số khách hàng lớn nhất thế giới đang sử dụng chúng để quản lý nhân sự và dữ liệu, định tuyến đường dẫn thay thế, mạng & quản lý trung tâm dữ liệu, phát hiện gian lận theo thời gian thực, tin sinh học, v.v.

Ngôn ngữ truy vấn Cypher của Neo4j là ngôn ngữ truy vấn khai báo duy nhất được xây dựng rõ ràng cho đồ thị tài sản.Nó lấy tất cả các bài học rút ra từ API Java nguyên gốc 13 năm của chúng tôi (là cơ sở cho Kế hoạch chi tiết, một số cơ sở dữ liệu đồ thị khác đã được áp dụng) và cuộn chúng thành ngôn ngữ thế hệ tiếp theo. Cypher là một cách tuyệt vời để tìm hiểu các đồ thị và phát triển các ứng dụng; và luôn có Java API gốc nếu bạn có nhu cầu đặc biệt hoặc hiệu suất "kim loại trần" hiệu suất (tức là mili giây phụ so với một phần nghìn giây) trên hiệu suất. Neo4j được xây dựng từ mặt đất lên để hỗ trợ đồ thị, và có một công cụ lưu trữ đồ thị được xây dựng để lưu trữ các đồ thị; không giống như một số bổ sung gần đây cho hệ sinh thái cơ sở dữ liệu biểu đồ, được lưu trữ dưới dạng thư viện biểu đồ trên cơ sở dữ liệu không phải biểu đồ và chịu một số hạn chế vốn có. (ví dụ: FlockDB, vì nó dựa trên MySQL, sẽ vẫn rất chậm đối với bất kỳ thứ gì lớn hơn một bước nhảy.)

Chắc chắn cảm thấy tự do khi liên hệ với nhóm Neo nếu bạn cần cụ thể hơn. Chúng tôi sẽ rất vui được giúp bạn! http://info.neotechnology.com/ContactUs.html

Chúc may mắn!

+1

Cảm ơn Philip! Neo4j là đủ cho các yêu cầu của tôi kể từ bây giờ và vì vậy tôi đã đi trước với nó. Ngoài ra tôi tin rằng nó sẽ có thể mở rộng quy mô độc đáo và quy mô theo nghĩa riêng của nó. Plus tôi cũng thấy rằng các cluster4j sao lưu và sao lưu là miễn phí cho các ngôi sao nhỏ (ít hơn 3 nhân viên hoặc $ 100k doanh thu) mà thực sự là tuyệt vời đối với tôi. Ngoài ra tôi nhận ra Neo4j có một dấu chân lớn hơn nhiều và người hâm mộ theo sau. Tôi đã đi qua Titan và nó có vẻ là thực sự thích hợp cho các đồ thị cực lớn và vì vậy tôi đã đưa lên bài đăng này. Tôi tin rằng với các tổ chức lớn như .... – DevD

+1

.... facebook và linkedin có kiến ​​trúc quy mô ngang phù hợp sẽ là bắt buộc. Nhưng khi tôi nói tôi không lớn như những người khác và tôi đã bắt đầu làm việc trên Neo4j một vài tháng trở lại vì vậy tôi không dám loại trừ khả năng Neo4j về quy mô và tôi thực sự yêu thương làm việc trên Neo4j. – DevD

24

Chúng tôi có biểu đồ xã hội trong đó trong một ngày chúng tôi thêm gần 1 triệu nút và gấp đôi số cạnh. Chúng tôi bắt đầu với đồ thị neo4j bởi vì có, nó rất nhanh do thực tế là lưu trữ của nó là trên cùng một máy mà trên đó động cơ đồ thị chạy. Nhưng sau đây là những trải nghiệm mà chúng tôi muốn chia sẻ với bạn về neo4j.

  1. Không phù hợp với truy vấn thời gian thực. Chúng tôi có cấu trúc xã hội như twitter. Chúng tôi phải hiển thị 20 hoạt động mới nhất (và các hoạt động liên quan của nó) của tất cả người dùng mà người dùng theo dõi trên dòng thời gian của mình. Chúng tôi có một số người dùng theo dõi hơn 1000 người dùng. Truy vấn gremlin mà chúng tôi đã viết cho điều này (nếu bạn quan tâm thì chúng tôi có thể chia sẻ truy vấn gremlin) thực sự tạo ra rất nhiều GC là một máy chủ có 8 cpu và 48 gb ram được sử dụng để đóng băng và chúng tôi phải khởi động lại máy chủ để trực tuyến lại .
  2. Nhiều phân đoạn mạng thời gian được quan sát.
  3. Không có chỉ số trung tâm đỉnh được yêu cầu rất nhiều trong cơ sở dữ liệu graoh.

Cuối cùng chúng tôi đang phai mờ với hiệu suất máy chủ với truy vấn gremlin mà chúng tôi phải thay đổi cơ sở dữ liệu thành titan.

Trên titan chúng tôi đang nhận được hiệu suất hợp lý và cũng mở rộng quy mô là rất dễ dàng như chúng tôi đang sử dụng cassandra như lưu trữ phụ trợ. Nhưng tâm trí bạn rằng .. bằng cách sử dụng gremlin ở đây cũng không phải là một ý tưởng tốt như truy vấn multiget là rất xấu xí để viết và không có multiget truy vấn của nó trở nên rất chậm.

+2

Xin chào. Tôi thực sự muốn biết thêm về thiết lập của bạn. Sẽ thật tuyệt nếu bạn có thể viết blog. Nếu bạn thích nói chuyện riêng tư với sorenbs im trên twitter hoặc gmail. – sorenbs

+2

Tại sao Gremlin và không mã hóa? Và đây là Neo 1.9 hay 2? Chỉ tò mò thôi. –

+0

Xin chào, bây giờ đã hơn một năm kể từ khi chúng tôi sử dụng nó. Nó chắc chắn không phải là 2, hoặc là 1,6 hoặc 1,7. Tôi không nhớ chính xác. Vào thời điểm đó cypher không phải là phổ biến, nó vẫn còn ở dạng mới. Ưu điểm chính của titan trên neo4j như tôi cảm nhận hiện nay là khả năng mở rộng và cung cấp nhiều hơn một chỉ số trung tâm đỉnh (VCI) trong trường hợp của chúng ta trở nên rất quan trọng vì chúng ta thường có rất nhiều trẻ em và không có VCI hôn mê. – user2772346

Các vấn đề liên quan