Chỉ cần bắt đầu chuyến tham quan của tôi với các phương pháp và công cụ xử lý đồ thị. Về cơ bản chúng ta làm - đếm một số số liệu chuẩn như pagerank, hệ số phân cụm, số tam giác, đường kính, kết nối ... Trong quá khứ đã hài lòng với Octave, nhưng khi bắt đầu làm việc với đồ thị, chúng ta hãy nói 10^9 nút/cạnh .Neo4j hoặc GraphX / Giraph những gì để lựa chọn?
đám mây Vì vậy, các giải pháp khả thi có thể được phân phối được thực hiện với Hadoop/Giraph, Spark/GraphX, Neo4j trên đầu trang của họ, vv
Nhưng kể từ khi tôi là một người mới bắt đầu, ai đó có thể tư vấn cho những gì thực sự để lựa chọn? Tôi đã không nhận được sự khác biệt khi sử dụng Spark/GraphX và khi Neo4j? Ngay bây giờ tôi xem xét Spark/GraphX, vì nó có nhiều cú pháp giống như Python, trong khi neo4j có Cypher riêng. Visualization trong neo4j là mát mẻ nhưng không hữu ích trong quy mô lớn như vậy. Tôi không hiểu là có một lý do để sử dụng mức độ bổ sung của phần mềm (neo4j) hoặc chỉ cần sử dụng Spark/GraphX? Kể từ khi tôi hiểu neo4j sẽ không tiết kiệm rất nhiều thời gian như nếu chúng tôi làm việc với hadoop tinh khiết vs Giraph hoặc GraphX hoặc Hive.
Cảm ơn bạn.
ý của bạn là gì bằng cách sử dụng "Neo4j với GraphX"? Bạn có nghĩa là sử dụng chúng cùng một lúc? Như thế nào và tại sao? –
Có thể khả thi khi sử dụng trình kết nối neo4j-spark mà tôi đã cung cấp với liên kết dưới dạng câu trả lời. –