Tôi có một dataframe gấu trúc df
:Làm thế nào tạo ra tất cả các cặp giá trị, từ kết quả của một groupby, trong một dataframe gấu trúc
ID words
1 word1
1 word2
1 word3
2 word4
2 word5
3 word6
3 word7
3 word8
3 word9
Tôi muốn tạo ra một dataframe rằng sẽ tạo ra tất cả các cặp của các từ trong mỗi nhóm. Vì vậy, các kết quả cho ở trên sẽ là:
ID wordA wordB
1 word1 word2
1 word1 word3
1 word2 word3
2 word4 word5
3 word6 word7
3 word6 word8
3 word6 word9
3 word7 word8
3 word7 word9
3 word8 word9
Tôi biết rằng tôi có thể sử dụng df.groupby['words']
để có được những lời trong mỗi ID
.
Tôi cũng biết rằng tôi có thể sử dụng
iterable = ['word1','word2','word3']
list(itertools.combinations(iterable, 2))
để có được tất cả các kết hợp cặp càng tốt. Tuy nhiên, tôi là một chút bị mất như là cách tốt nhất để tạo ra một dataframe kết quả như được hiển thị ở trên.
Tôi đã chỉnh sửa tiêu đề để phản ánh tốt hơn vấn đề thực tế yo u đang cố gắng giải quyết. –
không có tiêu đề mới không có gì để làm với những gì tôi muốn ... cảm ơn cho các nỗ lực mặc dù ... – BKS
Có thể trùng lặp: https://stackoverflow.com/questions/43800390/how-to-create-all-combinations- column-wise-for-multiple-variables-in-pandas –