Sử dụng phép phân lớp (ví dụ: vịnh ngây thơ hoặc SVM), và StringToWordVector, sẽ có thể sử dụng TF/IDF và đếm tần số cụm từ trong toàn bộ lớp hiện tại thay vì tìm kiếm trong một tài liệu?Có thể TF/IDF lấy các lớp học trong tài khoản
Để tôi giải thích, tôi muốn tính toán cho điểm cao đối với các từ rất thường xuyên cho một lớp nhất định (không chỉ cho một tài liệu nhất định) nhưng không thường xuyên trong toàn bộ kho văn bản.
Có thể thoát khỏi hộp hoặc điều này cần thêm một số phát triển không?
Cảm ơn :)