Giả sử tôi có một danh sách lớn các đối tượng (hàng nghìn hoặc hàng chục nghìn), mỗi đối tượng được gắn thẻ với một số thẻ. Có hàng tá hoặc hàng trăm thẻ có thể và cách sử dụng của chúng tuân theo luật năng lượng điển hình: một số thẻ được sử dụng vô cùng thường xuyên nhưng hầu hết đều hiếm. Tất cả các thẻ thường xuyên nhất có thể bỏ qua, trong thực tế.Hiển thị dữ liệu: Biểu đồ bong bóng, biểu đồ Venn và các thẻ mây (oh my!)
Bây giờ vấn đề là làm thế nào để hình dung mối quan hệ giữa các thẻ này. Đám mây từ khóa là một hình ảnh đẹp về tần số của chúng nhưng nó bỏ qua những thẻ nào xảy ra với các thẻ khác. Giả sử thẻ: thanh chỉ xuất hiện trên các đối tượng cũng được gắn thẻ: foo. Điều đó phải rõ ràng. Tương tự như vậy đối với ba thẻ có xu hướng xảy ra cùng nhau.
Bạn có thể làm cho mỗi thẻ trở thành bong bóng và cho phép chúng chồng lên nhau một phần. Về mặt kỹ thuật, đó là biểu đồ Venn nhưng xử lý nó theo cách đó có thể khó sử dụng. Ví dụ: biểu đồ của Google có thể tạo biểu đồ Venn, nhưng chỉ dành cho 3 hoặc ít hơn bộ (thẻ): http://code.google.com/apis/chart/docs/gallery/venn_charts.html
Lý do chúng biểu thị thành 3 bộ là nhiều hơn và có vẻ khủng khiếp. Xem "mức độ mở rộng cho số lượng bộ cao hơn" trên trang Wikipedia: http://en.wikipedia.org/wiki/Venn_diagrams
Nhưng đó chỉ là nếu mọi giao lộ có thể không trống. Nếu không quá 3 thẻ xảy ra (có thể sau khi ném ra các thẻ hiếm) thì một tập hợp các biểu đồ Venn có thể hoạt động (với kích thước của các bong bóng đại diện cho tần số thẻ).
Hoặc có thể là một biểu đồ (như ở đỉnh và cạnh) có cạnh dày hơn hoặc mỏng hơn để thể hiện tần suất xuất hiện đồng thời.
Bạn có ý tưởng hay chỉ dẫn nào về công cụ hoặc thư viện không? Lý tưởng nhất là tôi làm điều này với javascript nhưng tôi mở cho những thứ như R và Mathematica hoặc thực sự bất cứ điều gì khác. Tôi rất vui khi chia sẻ một số dữ liệu thực tế (bạn sẽ cười nếu tôi nói với bạn những gì nó đại diện) nếu có ai tò mò.
Phụ lục: Ứng dụng tôi đã lưu ý ban đầu là TagTime nhưng điều này cũng xảy ra với tôi rằng vấn đề này cũng ảnh hưởng đến vấn đề hình dung dấu trang ngon của một người.
Bạn dường như đã bỏ qua các bit về * trình * từ câu hỏi của bạn. –
Bạn có sở thích ngôn ngữ không? Ngoài ra, bạn có muốn viết ứng dụng dành cho máy tính để bàn hoặc ứng dụng web không? –
Anh ta hỏi anh ta nên sử dụng thư viện nào. Trừ khi, anh ta quan tâm đến việc kiểm tra một cuốn sách, đây có lẽ là một câu hỏi lập trình. –