2010-12-28 33 views

Trả lời

6

Giải pháp đơn giản: Đếm lần xuất hiện của từ trong văn bản.

Để làm một công việc tốt, mặc dù là một vấn đề khó khăn mà các công ty như Google đã làm việc trong nhiều năm. Nếu có thể, bạn có thể muốn có một cái nhìn tại using their technology

Để mở rộng, hãy thử như sau:

  • Sử dụng một cuốn từ điển (ví dụ WordNet để thay thế tất cả các từ đồng nghĩa với một từ chung
  • Dò tìm các từ tương tự sử dụng Levenshtein distance

Điều đó vẫn chỉ giúp bạn có được cho đến nay. Bạn sẽ cần phải thực hiện một số quy trình xử lý ngôn ngữ tự nhiên để thực sự hiểu được mô tả về phân biệt giữa nhiều tex ts chứa từ khóa cùng số lần.

+0

Cảm ơn bạn! Levenshtein khoảng cách là điều tôi đã cố gắng nhớ lại yeah :) Trong trường hợp của tôi tôi không cần bất kỳ chế biến hardcore. Chỉ muốn mang lại điểm số trên 100 cho văn bản mô tả ngắn thực sự. – fgungor

Các vấn đề liên quan