Khi nhập câu hỏi, stackoverflow trình bày cho bạn một danh sách các câu hỏi mà nó cho rằng có khả năng bao gồm cùng một chủ đề. Tôi cũng đã thấy các tính năng tương tự trên các trang khác hoặc trong các chương trình khác (ví dụ như hệ thống tập tin trợ giúp), nhưng tôi chưa bao giờ tự mình lập trình một cái gì đó như thế này. Bây giờ tôi tò mò muốn biết những gì sắp xếp của một thuật toán sẽ sử dụng cho điều đó.Làm cách nào để so sánh các cụm từ cho sự giống nhau?
Cách tiếp cận đầu tiên đến với tâm trí của tôi là chia cụm từ thành các từ và tìm cụm từ chứa các từ này. Trước khi bạn làm điều đó, bạn có thể muốn vứt bỏ những từ không đáng kể (như 'the', 'a', 'does' etc), và sau đó bạn sẽ muốn xếp hạng kết quả.
Hey, chờ đợi - chúng ta hãy làm điều đó cho các trang web, và sau đó chúng ta có thể có một ... watchamacallit ... - một "công cụ tìm kiếm", và sau đó chúng ta có thể bán quảng cáo, và sau đó ...
Không, nghiêm túc, cách phổ biến để giải quyết vấn đề này là gì?
Cảm ơn bạn! Điều này đã giúp. –