Làm thế nào tôi có thể yêu cầu NLTK xử lý văn bản bằng một ngôn ngữ cụ thể?NLTK/pyNLTK có thể hoạt động "cho mỗi ngôn ngữ" (nghĩa là không phải tiếng Anh) hay không?
Thỉnh thoảng, tôi viết thường trình NLP chuyên biệt để thực hiện gắn thẻ POS, mã thông báo và vv trên miền văn bản không phải tiếng Anh (nhưng vẫn là hindo-Châu Âu).
Câu hỏi này dường như để giải quyết chỉ corpora khác nhau, không phải là sự thay đổi trong mã/cài đặt: POS tagging in German
Ngoài ra, là có bất kỳ Hebrew/Tây Ban Nha/Ba Lan NLP module chuyên dùng cho python?
cảm ơn. punkt câu tokenizer có vẻ đúng hướng. –
Làm thế nào để bạn có được treetagger để làm việc? http://stackoverflow.com/questions/15503388/treetagger-installation-successful-but-cannot-open-par-file – alvas