Thuật toán kết hợp mờ phù hợp nhất (Logic mờ, N-Gram, Levenstein, Soundex ....,) để xử lý hơn 100000 bản ghi trong thời gian ít hơn là gì?Thuật toán kết hợp mờ phù hợp nhất?
26
A
Trả lời
21
Tôi khuyên bạn nên đọc các bài viết của Navarro được đề cập trong phần Refences của bài viết trên Wikipedia có tiêu đề Approximate string matching. Đưa ra quyết định của bạn dựa trên nghiên cứu thực tế luôn tốt hơn đề xuất ngẫu nhiên người lạ .. Đặc biệt nếu hiệu suất trên một bộ bản ghi đã biết là quan trọng đối với bạn.
3
Nó ồ ạt phụ thuộc vào dữ liệu của bạn. Một số bản ghi có thể được kết hợp tốt hơn so với các bản ghi khác. Ví dụ mã bưu điện là định dạng được xác định để có thể được so sánh theo một cách khác với các chuỗi thông thường. Mọi người có thể được so khớp với tên viết tắt và DOB hoặc các kết hợp khác, v.v.
Các vấn đề liên quan
- 1. Thuật toán lập lịch trình phù hợp tốt nhất
- 2. thuật toán kết hợp
- 3. Thuật toán tốt nhất cho màu phù hợp.
- 4. Thuật toán phù hợp với OpenCV
- 5. Thuật toán giải mã nào phù hợp nhất để loại bỏ chuyển động mờ khỏi văn bản?
- 6. Thuật toán xếp hạng/mức độ phù hợp tìm kiếm
- 7. Thu thập thuật toán kết hợp
- 8. quy tắc phù hợp cho một đầu vào (thuật toán)
- 9. chuỗi mờ phù hợp với trọng số kỳ hạn
- 10. Kết hợp văn bản mờ C#
- 11. Mẫu thiết kế nào phù hợp nhất?
- 12. Kết hợp các chuỗi mờ
- 13. Có ai có thuật toán Trường hợp phù hợp hay không
- 14. Kết hợp mờ của tên sản phẩm
- 15. Bảng phức tạp kết hợp thuật toán javascript & jquery
- 16. Phương trình phù hợp và kết quả phù hợp
- 17. Thuật toán để tổng hợp chữ số?
- 18. Ba cách hợp nhất thuật toán cho văn bản
- 19. Chuỗi mờ phù hợp với Rails (Tire) và ElasticSearch
- 20. Thuật toán để phù hợp với thời gian phụ thuộc (1D) Tín hiệu
- 21. Erlang vs OCaml (thích hợp nhất để phù hợp)
- 22. Tỷ lệ phần trăm của các kết quả phù hợp sử dụng Levenshtein Khoảng cách phù hợp với
- 23. Sự khác biệt giữa các thuật toán phù hợp trong scipy
- 24. Kết hợp tìm kiếm php (mờ)
- 25. Thuật toán để thực hiện sự phù hợp đa thức của một bộ dữ liệu
- 26. Thuật toán để nén tập hợp thử
- 27. Kết hợp các hợp nhất thành một hợp nhất
- 28. Tôi làm cách nào để xây dựng thuật toán phù hợp?
- 29. Thuật toán sắp xếp nào phù hợp với điều kiện 'giống như luồng' này?
- 30. Cách tìm kết quả mờ phù hợp nhất cho chuỗi trong cơ sở dữ liệu chuỗi lớn
Tôi tưởng tượng rằng @Mitch Wheat * muốn nói là sẽ rất khó để đưa ra câu trả lời dứt khoát cho câu hỏi này, vì giải pháp tốt nhất sẽ phụ thuộc nhiều vào các đặc điểm của kiến trúc hệ thống và đầu vào của bạn. Như Tim đã đề cập trong câu trả lời của mình, bạn nên đọc về những điểm mạnh và điểm yếu của các thuật toán này, và sau đó kiểm tra những cái có vẻ thích hợp cho chính mình. – DougW