Tôi tính giá trị tf/idf của hai tài liệu. Sau đây là các tf/giá trị idf:Độ tương tự Cosine
1.txt
0.0
0.5
2.txt
0.0
0.5
Các tài liệu này như:
1.txt = > dog cat
2.txt = > cat elephant
Làm thế nào tôi có thể sử dụng những giá trị này để tính toán sự tương đồng cosin?
Tôi biết rằng tôi nên tính toán sản phẩm chấm, sau đó tìm khoảng cách và chia dấu chấm sản phẩm theo nó. Làm thế nào tôi có thể tính toán điều này bằng cách sử dụng các giá trị của tôi?
Một câu hỏi khác: Điều quan trọng là cả hai tài liệu phải có cùng số từ?
Đó không phải là thích hợp hơn cho http://mathoverflow.net /? –
một nhiệm vụ truy xuất thông tin của nó, không phải là một cái gì đó một người toán học thuần túy sẽ quan tâm về –
Hãy dừng đề xuất mathoverflow.net - đó là cho các câu hỏi toán học nghiêm trọng. –