Tôi có một tập tin văn bản với khoảng 8,5 triệu điểm dữ liệu theo hình thức:Sử dụng Python để tạo ra một biểu đồ kết nối/mạng
Company 87178481
Company 893489
Company 2345788
[...]
Tôi muốn sử dụng Python để tạo ra một biểu đồ kết nối để xem những gì các mạng giữa các công ty trông như thế nào. Từ ví dụ trên, hai công ty sẽ chia sẻ lợi thế nếu giá trị trong cột thứ hai là như nhau (làm rõ từ/cho Được ghép nối).
Tôi đã sử dụng gói NetworkX và đã có thể tạo mạng cho vài nghìn điểm, nhưng nó không làm cho nó thông qua tệp văn bản đầy đủ 8,5 triệu nút. Tôi chạy nó và để lại trong khoảng 15 giờ, và khi tôi trở lại, con trỏ trong vỏ vẫn nhấp nháy, nhưng không có đồ thị đầu ra.
Có an toàn để cho rằng nó vẫn đang chạy? Có cách tiếp cận tốt hơn/nhanh hơn/dễ dàng hơn để vẽ đồ thị hàng triệu điểm không?
Các công ty được kết nối như thế nào? I E. là một cạnh được chia sẻ giữa công ty A và B nếu cột thứ hai là như nhau? – Hooked
Vâng, đó là chính xác. – Jon
Không thể nói rằng tôi đã có bất kỳ vấn đề với 8.5million trong networkx. Bạn có bao nhiêu đỉnh khác nhau? Bạn đang sử dụng đạo diễn/không hướng dẫn? Ngoài ra, khi bạn nói "không có biểu đồ đầu ra" - bạn có ý nghĩa gì? [ví dụ, bạn không cố gắng in nó hoặc một cái gì đó] –