Tôi đang tìm thư viện có thể thực hiện phân tích hình thái về từ tiếng Đức, nghĩa là nó chuyển đổi bất kỳ từ nào thành dạng gốc và cung cấp thông tin meta về từ được phân tích.Có thư viện miễn phí để phân tích hình thái học tiếng Đức không?
Ví dụ:
gegessen -> essen
wurde [...] gefasst -> fassen
Häuser -> Haus
Hunde -> Hund
danh sách mong ước của tôi:
- Nó phải làm việc với cả danh từ và động từ.
- Tôi biết rằng đây là một nhiệm vụ rất khó khăn do tính phức tạp của ngôn ngữ Đức, vì vậy tôi cũng tìm kiếm các libar chỉ cung cấp xấp xỉ hoặc chỉ có thể chính xác đến 80%.
- Tôi thích các thư viện không hoạt động với từ điển, nhưng một lần nữa tôi mở để thỏa hiệp cho các cirumstances.
- Tôi cũng thích thư viện Windows C/C++/Delphi hơn, bởi vì điều đó sẽ làm cho chúng dễ tích hợp hơn nhưng .NET, Java, ... cũng sẽ làm.
- Nó phải là một thư viện miễn phí. (L) GPL, MPL, ...
EDIT: Tôi biết rằng không có cách nào để thực hiện một phân tích hình thái mà không cần bất kỳ từ điển nào cả, bởi vì các từ bất quy tắc. Khi tôi nói, tôi thích một thư viện mà không cần một cuốn từ điển Ý tôi là những điển thổi đầy đủ mà bản đồ mỗi từ:
arbeite -> arbeiten
arbeitest -> arbeiten
arbeitet -> arbeiten
arbeitete -> arbeiten
arbeitetest -> arbeiten
arbeiteten -> arbeiten
arbeitetet -> arbeiten
gearbeitet -> arbeiten
arbeite -> arbeiten
...
Những bộ từ điển có một số nhược điểm, trong đó có kích thước rất lớn và không có khả năng xử lý các từ chưa biết.
Tất nhiên tất cả các trường hợp ngoại lệ chỉ có thể được xử lý với một cuốn từ điển:
esse -> essen
isst -> essen
eßt -> essen
aß -> essen
aßt -> essen
aßen -> essen
...
(Tâm trí tôi đang quay ngay bây giờ :))
Bạn đang phần nào đúng, tôi cập nhật câu hỏi của tôi. –