Tôi cần phải phân loại văn bản và tôi đang sử dụng mô-đun python Text blob để đạt được nó. Tôi có thể sử dụng cây phân loại Naive Bayes/Decision. Tôi lo ngại về các điểm được đề cập dưới đây.Phân loại văn bản trong python - (NLTK Sentence based)
1) Tôi cần phải phân loại câu làm đối số/Không phải là đối số. Tôi đang sử dụng hai bộ phân loại và đào tạo mô hình bằng cách sử dụng các tập dữ liệu apt. Câu hỏi của tôi là tất cả về tôi cần đào tạo mô hình với chỉ từ khóa? hoặc tôi có thể đào tạo tập dữ liệu với tất cả các đối số có thể và không đối số câu mẫu? Mà sẽ là cách tiếp cận tốt nhất về độ chính xác phân loại văn bản và thời gian để lấy?
2) Vì phân loại sẽ là đối số/không phải là đối số, trình phân loại nào sẽ tìm nạp kết quả chính xác? Nó là Naive Bayes/cây quyết định/vịnh Naive tích cực?
Xin cảm ơn trước.