Cố gắng đọc csv file vào gấu trúc dataframe như sau định dạngThiết loại cột khi đọc csv với gấu trúc
dp = pd.read_csv('products.csv', header = 0, dtype = {'name': str,'review': str,
'rating': int,'word_count': dict}, engine = 'c')
print dp.shape
for col in dp.columns:
print 'column', col,':', type(col[0])
print type(dp['rating'][0])
dp.head(3)
Đây là kết quả:
(183531, 4)
column name : <type 'str'>
column review : <type 'str'>
column rating : <type 'str'>
column word_count : <type 'str'>
<type 'numpy.int64'>
Tôi có thể hiểu rằng gấu trúc có thể gặp khó khăn khi chuyển đổi biểu diễn chuỗi từ điển thành từ điển được cho this và this. Nhưng làm cách nào để nội dung của cột "xếp hạng" có thể là cả str và numpy.int64 ???
Nhân tiện, các chỉnh sửa như không chỉ định động cơ hoặc tiêu đề sẽ không thay đổi bất kỳ thứ gì.
Trân trọng cảm ơn
Cảm ơn, đó là một phần trượt trên phần của tôi :) Tôi chọn đây là câu trả lời được chấp nhận vì đó là câu trả lời trực tiếp cho câu hỏi của tôi. – user2738815
Tôi đoán đó là lỗi đánh máy, đôi khi khó phát hiện khi tập trung vào mã;) –