Tôi muốn tính mức độ liên quan của từ khóa với văn bản mô tả ngắn. Điều gì sẽ là cách tiếp cận tốt nhất về hiệu quả và dễ thực hiện. Tôi đang sử dụng C + +?Thuật toán để tính toán mức độ liên quan của từ khóa với văn bản ngắn (50 - 100 từ)
5
A
Trả lời
6
Giải pháp đơn giản: Đếm lần xuất hiện của từ trong văn bản.
Để làm một công việc tốt, mặc dù là một vấn đề khó khăn mà các công ty như Google đã làm việc trong nhiều năm. Nếu có thể, bạn có thể muốn có một cái nhìn tại using their technology
Để mở rộng, hãy thử như sau:
- Sử dụng một cuốn từ điển (ví dụ WordNet để thay thế tất cả các từ đồng nghĩa với một từ chung
- Dò tìm các từ tương tự sử dụng Levenshtein distance
Điều đó vẫn chỉ giúp bạn có được cho đến nay. Bạn sẽ cần phải thực hiện một số quy trình xử lý ngôn ngữ tự nhiên để thực sự hiểu được mô tả về phân biệt giữa nhiều tex ts chứa từ khóa cùng số lần.
3
Tham khảo những câu hỏi Stack Overflow trước:
Các vấn đề liên quan
- 1. Thuật toán để tìm các từ liên quan trong văn bản
- 2. Thuật toán để tính toán chế độ
- 3. Thuật toán xếp hạng/mức độ phù hợp tìm kiếm
- 4. Thuật toán hiệu quả để tìm tất cả các từ khóa trong một văn bản
- 5. Thuật toán rút ngắn URL
- 6. Thuật toán của Lucene
- 7. Thuật toán để tính toán nghịch đảo của đa thức
- 8. Thuật toán để tính toán vị trí gần nhất dựa trên kinh độ và vĩ độ
- 9. Thuật toán dự đoán từ
- 10. Thuật toán để tìm các từ khóa và cụm từ khóa trong một chuỗi
- 11. Lowe tính toán “độ lặp lại” của thuật toán SIFT của mình như thế nào?
- 12. Thuật toán nào sử dụng khả năng đọc để trích xuất văn bản từ URL?
- 13. Thuật toán so sánh văn bản
- 14. Hiểu thuật toán Mapreduce để tính toán chồng chéo
- 15. Binary GCD Thuật toán so với Euclid của thuật toán trên máy tính hiện đại
- 16. Thuật toán nén hiệu quả cho các chuỗi văn bản ngắn
- 17. Thuật toán C# Diff cho văn bản
- 18. Thuật toán liên kết ký tự Java
- 19. Thuật toán để có bản đồ độ sâu gần đúng từ hình ảnh nổi/trợ giúp
- 20. Làm cách nào để tính toán độ phức tạp chính xác của thuật toán?
- 21. RSA: Tính toán khóa riêng với thuật toán Euclide mở rộng
- 22. Thuật toán bọc từ cho tiếng Nhật
- 23. Thuật toán hoặc thư viện để phân tích văn bản, cụ thể: từ, cụm từ trên văn bản và tập hợp văn bản
- 24. Thuật toán để nhận màu văn bản tốt nhất
- 25. Thuật toán tranh giành từ hiệu quả
- 26. Thuật toán Eppstein và thuật toán của Yen cho k đường đi ngắn nhất
- 27. Thuật toán nhanh để tính toán giai thừa
- 28. Có những thuật toán đã biết của thuật toán tính toán sai số màu CIEDE2000 hoặc CIE94 Delta-E không?
- 29. Thuật toán nhanh để tìm kiếm mẫu trong tệp văn bản
- 30. Tạo khóa thuật toán RSA
Cảm ơn bạn! Levenshtein khoảng cách là điều tôi đã cố gắng nhớ lại yeah :) Trong trường hợp của tôi tôi không cần bất kỳ chế biến hardcore. Chỉ muốn mang lại điểm số trên 100 cho văn bản mô tả ngắn thực sự. – fgungor