Tôi đang sử dụng một đường ống rất giống với một trao in this example:lấy tính năng trung gian từ một đường ống dẫn trong Scikit (Python)
>>> text_clf = Pipeline([('vect', CountVectorizer()),
... ('tfidf', TfidfTransformer()),
... ('clf', MultinomialNB()),
... ])
qua mà tôi sử dụng GridSearchCV
để tìm các ước lượng tốt nhất trên một mạng lưới tham số.
Tuy nhiên, tôi muốn lấy tên cột của bộ đào tạo của mình bằng phương pháp get_feature_names()
từ CountVectorizer()
. Điều này có thể thực hiện được nếu không triển khai CountVectorizer()
ngoài đường ống không?