Tôi đang sử dụng cả hai Daitch-Mokotoff soundexing và Damerau-Levenshtein để tìm hiểu xem một mục nhập người dùng và một giá trị trong ứng dụng là "giống nhau" hay không.Tính khoảng cách Levenshtein tương đối - có ý nghĩa?
Khoảng cách Levenshtein có được sử dụng như một giá trị tuyệt đối không? Nếu tôi có một từ 20 chữ cái, khoảng cách 4 không quá tệ. Nếu từ này có 4 chữ cái ...
Điều tôi đang làm là lấy khoảng cách/chiều dài để có khoảng cách phản ánh tốt hơn phần trăm của từ đã được thay đổi.
Đó có phải là cách tiếp cận hợp lệ/đã được chứng minh không? Hay là nó ngu ngốc?
Đây không phải là một cách tiếp cận rất ngu ngốc, nó đã được sử dụng trước đó với một số thành công. Tuy nhiên, có những biện pháp tốt hơn. –
Ý kiến của bạn là gì? –