Mục tiêu của tôi là phân tích một số tài liệu (twitter cho bây giờ) cho nội dung cảm xúc. Chỉ cần hôm nay tôi nhận ra nó sẽ làm cho một chút ý nghĩa để tìm kiếm từ thân cây như trái ngược với việc có một danh sách đầy đủ các thân từ cảm xúc. Và vì vậy tôi đã khám phá nltk.stem chỉ để nhận ra rằng có 4 gốc khác nhau. Tôi muốn hỏi các nhà ngôn ngữ học stackoverflow cho dù LancasterStemmer, PorterStemmer, RegexpStemmer, RSLPStemmer, hay WordNetStemmer là tốt nhất là tốt nhất với một số biện minh.Tôi nên sử dụng từ ngữ nào trong nltk?
Trả lời
RSLP dành cho người portugese. Tôi đoán bạn muốn tiếng anh. Regexp sẽ yêu cầu bạn phát triển các biểu thức gốc của riêng bạn, vì vậy tôi nghĩ rằng có thể được bỏ qua là tốt. WordnetStemmer yêu cầu bạn biết phần lời nói của từ đó, vì vậy bạn phải thực hiện gắn thẻ pos trước để sử dụng nó. Tôi đã sử dụng thuật toán gốc porter và nó khá tốt, nhưng thuật toán lancaster là mới hơn, vì vậy nó có thể tốt hơn. Bạn có thể muốn thử sử dụng kết hợp cuống, nơi bạn chọn thân ngắn nhất từ mỗi gốc. Dù sao, dòng dưới cùng là PorterStemmer là một lựa chọn mặc định tốt.
Có thể có một chút khác biệt so với bạn đang yêu cầu, nhưng thư viện Nodebox Lingustics chứa hàm is_emotive() có vẻ như kiểm tra các từ để xem chúng có phải là từ đồng nghĩa đệ quy của những từ tình cảm nhất định không. Từ commonsense.py
ekman = ["anger", "disgust", "fear", "joy", "sadness", "surprise"]
other = ["emotion", "feeling", "expression"]
Không phải là người gửi thư mà là phương pháp thú vị để kiểm tra.
- 1. Tôi nên sử dụng ngữ cảnh nào trong AlertDialog.Builder?
- 2. Làm thế nào để sử dụng NLTK để tạo câu từ ngữ pháp gây ra?
- 3. Tôi có nên sử dụng LingPipe hoặc NLTK để trích xuất tên và địa điểm không?
- 4. Trích từ sử dụng nltk từ văn bản tiếng Đức
- 5. NLTK pos_tag sử dụng
- 6. Tôi nên sử dụng JSObject nào?
- 7. Tôi nên sử dụng PreApplicationStartMethod nào?
- 8. Tôi nên sử dụng gói postgresql nào?
- 9. Khi nào tôi nên sử dụng stdClass và khi nào tôi nên sử dụng một mảng trong mã php oo?
- 10. Khi nào tôi nên sử dụng adorners?
- 11. Khi nào tôi nên sử dụng GC.SuppressFinalize()?
- 12. Khi nào tôi nên sử dụng ConcurrentSkipListMap?
- 13. Tôi nên sử dụng IronPython IDE nào?
- 14. Tôi nên sử dụng EventGus GWT nào?
- 15. Khi nào tôi nên sử dụng AQL?
- 16. Trong Jira Agile khi nào tôi nên sử dụng "Story" và khi nào tôi nên sử dụng "Cải tiến"
- 17. Thuật ngữ tài liệu thuật ngữ hiệu quả với NLTK
- 18. Khi nào tôi nên sử dụng SynchronousQueue
- 19. Tôi nên sử dụng ngôn ngữ và thư viện nào để làm việc với Gmail?
- 20. Khi nào tôi nên sử dụng require() và khi nào nên sử dụng define()?
- 21. Tập tin spam nào tôi có thể sử dụng trong NLTK?
- 22. Dự án tình báo nhân tạo - Tôi nên sử dụng ngôn ngữ nào?
- 23. So sánh sự giống nhau về các thuật ngữ/biểu thức sử dụng NLTK?
- 24. Khi nào tôi nên sử dụng Gói-Nhập khẩu và khi nào tôi nên sử dụng Yêu cầu-Gói?
- 25. Khi nào tôi nên sử dụng SnapsToDevicePixels trong WPF 4.0?
- 26. Tôi nên sử dụng ThreadPool nào trong Java?
- 27. Tôi nên sử dụng Fold nào trong VIM?
- 28. Khi nào tôi nên sử dụng khung MVC trong JavaScript?
- 29. Khi nào tôi nên sử dụng thuộc tính trong C#?
- 30. Khi nào tôi nên sử dụng "nguyên mẫu" trong JavaScript