Sử dụng gấu trúc 0.11 trên python 2.7.3 Tôi cố gắng để xoay một dataframe đơn giản với các giá trị sau:ReshapeError trong khi cố gắng xoay gấu trúc dataframe
StudentID QuestionID Answer DateRecorded
0 1234 bar a 2012/01/21
1 1234 foo c 2012/01/22
2 4321 bop a 2012/01/22
3 5678 bar a 2012/01/24
4 8765 baz b 2012/02/13
5 4321 baz b 2012/02/15
6 8765 bop b 2012/02/16
7 5678 bop c 2012/03/15
8 5678 foo a 2012/04/01
9 1234 baz b 2012/04/11
10 8765 bar a 2012/05/03
11 4321 bar a 2012/05/04
12 5678 baz c 2012/06/01
13 1234 bar b 2012/11/01
Tôi đang sử dụng lệnh sau:
df.pivot(index='StudentID', columns='QuestionID')
Nhưng tôi nhận được lỗi sau:
ReshapeError: Index contains duplicate entries, cannot reshape
Lưu ý rằng dataframe cùng mà không có sự lin cuối cùng e
13 1234 bar b 2012/11/01
Kết quả trục thành công trong sau:
Answer DateRecorded
QuestionID bar baz bop foo bar baz bop foo
StudentID
1234 a b NaN c 2012/01/21 2012/04/11 NaN 2012/01/22
4321 a b a NaN 2012/05/04 2012/02/15 2012/01/22 NaN
5678 a c c a 2012/01/24 2012/06/01 2012/03/15 2012/04/01
8765 a b b NaN 2012/05/03 2012/02/13 2012/02/16 NaN
Tôi mới vào pivoting và muốn biết lý do tại sao có StudentID trùng lặp, QuestionID cặp gây ra vấn đề này? Và, làm thế nào tôi có thể sửa lỗi này bằng hàm df.pivot()?
cảm ơn bạn.
Tôi đã thử các tính năng sau: http://stackoverflow.com/questions/13216087/pandas-dataframe-pivoting-issue, http://stackoverflow.com/questions/11232275/pandas-pivot-warning-about -repeated-entries-on-index và http://stackoverflow.com/questions/13216087/pandas-dataframe-pivoting-issue. Nhưng vấn đề vẫn còn đó. Ngoài ra, tôi không muốn một dataframe MultiIndexed overcomplicated trong kết quả. – iqbalnaved