2012-04-27 33 views
7

Tôi đã tự hỏi liệu có một API trong Java có thể xác định các từ và tìm nguồn gốc của các từ hay không. Tôi nhớ một thời gian trở lại tìm kiếm này và thấy "apache commons" nhưng tôi không chắc chắn.Xác định các từ bằng cách sử dụng Java

Vì vậy, về cơ bản, người dùng sẽ có thể nhập từ "tràn", sau đó chương trình sẽ có thể xác định từ. Vì vậy, tôi đang tìm kiếm một API có thể xác định các từ và tìm nguồn gốc của các từ. Vì vậy, từ "recherche" sẽ có nguồn gốc là "tiếng Pháp".

+1

Bạn đang tìm kiếm các [Bổ đề] (http : //en.wikipedia.org/wiki/Lemma_%28morphology%29) Các câu hỏi của bạn hơi mơ hồ, bạn nên làm rõ những gì bạn đang làm sau - tốt nhất là với một ví dụ: – amit

+0

Tôi đã thêm vào làm rõ. –

+1

Recherche cũng là một từ tiếng Đức Bạn nên lưu ý rằng cùng một từ có thể tồn tại bằng nhiều ngôn ngữ khác nhau: – oers

Trả lời

8

WordNet sẽ cung cấp cho bạn một nửa những gì bạn đang tìm kiếm: bạn có thể tìm kiếm định nghĩa cho một từ. Lưu ý rằng có một số triển khai của WordNet cho Java: jwi, jaws, Dan Bikel's, WordnetAPI. Một số trong số này có thể dễ sử dụng hơn cho mục đích của bạn hơn jwordnet được đề xuất bởi miku (Tôi chỉ sử dụng hàmjwi).

Lưu ý: WordNet sẽ không cung cấp cho bạn nguồn gốc (AFAIK). Tôi không biết một phần mềm nào.

Lưu ý: Bạn sẽ phải cung cấp lemma của một từ để có thể tra cứu nó trong từ điển. Điều này có nghĩa là bạn sẽ phải áp dụng một số kỹ thuật xử lý ngôn ngữ tự nhiên (NLP) nếu bạn muốn tự động thực hiện điều này trên một tài liệu văn bản tự do (có thể chứa các biểu mẫu bị thổi). Nếu bạn đi tuyến đường này, tôi sẽ đề xuất Morph plugin của dự án GATE.

4

Có một trang web cho từ nguyên: http://www.etymonline.com/

Nó cho kết quả: recherche 1722, từ Fr. recherché "cẩn thận tìm ra," trang rechercher "để tìm ra." Thường được sử dụng 19c. về thực phẩm, phong cách, v.v., để biểu thị sự xuất sắc tối nghĩa.

Không biết liệu họ có API hay không nhưng sử dụng một số loại tập lệnh để truy vấn nó.

Vì vậy, hãy tìm một cách tốt để phát hiện "Cha". trong câu trên.

Chúc mừng, Erik

2

Bạn đã tìm kiếm JWKTL?

"Wiktionary tiếng Việt là một đa ngôn ngữ, dựa trên web, từ điển có sẵn miễn phí, từ điển đồng nghĩa và cụm từ cuốn sách, được thiết kế như người bạn đồng hành từ vựng để Wikipedia.Gần đây, nó đã được công nhận là một từ vựng tài nguyên ngữ nghĩa đầy hứa hẹn cho các ứng dụng xử lý ngôn ngữ tự nhiên."

Sử dụng này, bạn sẽ nhìn thấy từ nguyên của từ.

Các vấn đề liên quan