Giả sử tôi có một DataFrame của tạo như thế này:Rẽ Pandas DataFrame các chuỗi vào histogram
import pandas as pd
s1 = pd.Series(['a', 'b', 'a', 'c', 'a', 'b'])
s2 = pd.Series(['a', 'f', 'a', 'd', 'a', 'f', 'f'])
d = pd.DataFrame({'s1': s1, 's2', s2})
Có khá nhiều thưa thớt trong các chuỗi trong các dữ liệu thực tế. Tôi muốn tạo biểu đồ về sự xuất hiện của các chuỗi trông giống như những gì được tạo ra bởi d.hist() (ví dụ: với subplots) cho s1 và s2 (một cho mỗi subplot).
Chỉ cần làm d.hist() cho lỗi này:
/Library/Python/2.7/site-packages/pandas/tools/plotting.pyc in hist_frame(data, column, by, grid, xlabelsize, xrot, ylabelsize, yrot, ax, sharex, sharey, **kwds)
1725 ax.xaxis.set_visible(True)
1726 ax.yaxis.set_visible(True)
-> 1727 ax.hist(data[col].dropna().values, **kwds)
1728 ax.set_title(col)
1729 ax.grid(grid)
/Library/Python/2.7/site-packages/matplotlib/axes.pyc in hist(self, x, bins, range, normed, weights, cumulative, bottom, histtype, align, orientation, rwidth, log, color, label, stacked, **kwargs)
8099 # this will automatically overwrite bins,
8100 # so that each histogram uses the same bins
-> 8101 m, bins = np.histogram(x[i], bins, weights=w[i], **hist_kwargs)
8102 if mlast is None:
8103 mlast = np.zeros(len(bins)-1, m.dtype)
/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/numpy/lib/function_base.pyc in histogram(a, bins, range, normed, weights, density)
167 else:
168 range = (a.min(), a.max())
--> 169 mn, mx = [mi+0.0 for mi in range]
170 if mn == mx:
171 mn -= 0.5
TypeError: cannot concatenate 'str' and 'float' objects
Tôi cho rằng tôi có thể tự đi qua từng loạt, làm một value_counts()
, sau đó âm mưu nó như là một âm mưu thanh, và tự tạo ra các ô phụ. Tôi muốn kiểm tra xem có cách nào đơn giản hơn không.
ag, đánh bại tôi! có, truy cập là công cụ cho công việc! –
Cảm ơn bạn đã phản hồi. value_counts làm điều tương tự, và là một loạt -> Series chuyển đổi (vì vậy không cần phải ép buộc nó trở lại vào một Series). Tôi đoán tôi đã tự hỏi nếu có một số tùy chọn để làm điều này đếm và âm mưu cho tôi tự động cho trường hợp cụ thể của dây, bởi vì có một cho ints. – amatsukawa