Tôi đang lên kế hoạch thực hiện một số điều chỉnh dữ liệu trên dữ liệu của mình.Làm cách nào để dự đoán tên quốc gia chính xác cho tên quốc gia do người dùng cung cấp?
Trường hợp -Tôi có dữ liệu có trường country
. Nó chứa tên quốc gia đầu vào của người dùng (Nó có thể chứa lỗi chính tả hoặc tên quốc gia khác nhau cho cùng một quốc gia như Hoa Kỳ/Hoa Kỳ/Hoa Kỳ cho Hoa Kỳ). Tôi có một danh sách tên quốc gia chính xác.
Điều tôi muốn - Để dự đoán quốc gia nào gần nhất mà nó đang đề cập đến. Ví dụ: Nếu U.S.
được cung cấp thì nó sẽ đổi thành USA
(tên quốc gia chính xác trong danh sách của chúng tôi).
Có cách nào tôi có thể làm điều đó bằng cách sử dụng Java hoặc opennlp hoặc bất kỳ phương pháp nào khác không?
Levenshtein Khoảng cách hữu ích !! Nhưng vấn đề là, đối với đất nước như 'USA', nếu dữ liệu có' Hoa Kỳ' thì khoảng cách sẽ đến nhiều hơn những gì cần phải làm !! – AngryLeo
@AyushBanka: Lúc đó, bạn có thể sử dụng API mà tôi đã thêm vào câu trả lời. [Git code] (https://gist.github.com/maephisto/9228207) có thể giúp bạn. Bạn có thể thêm vào của bạn. – iNikkz