Tôi đang cố gắng tải một sklearn.dataset và thiếu cột, theo các khóa (target_names, target & DESCR). Tôi đã thử các phương pháp khác nhau để bao gồm cột cuối cùng, nhưng có lỗi.Đang tải tập dữ liệu về SKLearn vào Pandas DataFrame
import numpy as np
import pandas as pd
from sklearn.datasets import load_breast_cancer
cancer = load_breast_cancer()
print cancer.keys()
các phím là [ 'target_names', 'dữ liệu', 'mục tiêu', 'DESCR', 'feature_names']
data = pd.DataFrame(cancer.data, columns=[cancer.feature_names])
print data.describe()
với đoạn code trên, nó chỉ trả lại 30 cột, khi tôi cần 31 cột. Cách tốt nhất là tải các tập dữ liệu scikit-learn vào pandas DataFrame.
bạn có thể giải thích lý do tại sao cần có 31 cột? Nếu bạn sử dụng 'cancer.data.shape' hoặc kiểm tra [mô tả tập dữ liệu] (http://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_breast_cancer.html), có vẻ như chỉ có 30 các cột trong tập dữ liệu. Bạn đã bỏ lỡ cột nào? –
Tôi thiếu cột target/target_names từ dataset.keys(), vì nó chưa được tải vào khung dữ liệu. – pythonhunter