Làm cách nào để có thể ánh xạ tiêu đề tới các cột trong gấu trúc?

Tôi có một dataframe như:Làm cách nào để có thể ánh xạ tiêu đề tới các cột trong gấu trúc?

Tôi muốn có:

A B C label 
1 0 0 A 
1 1 0 AB 
0 1 0 B 
0 0 1 C

Tôi đã cố gắng làm theo bản đồ hoặc áp dụng nhưng tôi không thể hình dung nó ra.

Nguồn

2017-09-12 sunny

In [101]: df['label'] = df.apply(lambda x: ''.join(df.columns[x.astype(bool)].tolist()), axis=1) 

In [102]: df 
Out[102]: 
    A B C label 
0 1 0 0  A 
1 1 1 0 AB 
2 0 1 0  B 
3 0 0 1  C

PS i chắc chắn sẽ chọn @Ted's solution như nó đẹp hơn nhiều và nhiều hơn thế nhiều ... nhanh hơn

Nguồn

2017-09-12 22:04:35 MaxU

"Trong [101]:" Tôi tự hỏi có gì khác trên sổ ghi chép đó – GiantsLoveDeathMetal

@GiantsLoveDeathMetal, cộng đồng Pandas của chúng tôi đang phát triển - thực sự đánh giá cao điều này! :-) – MaxU

@GiantsLoveDeathMetal Đây là lời nhắc thiết bị đầu cuối IPython, không phải sổ ghi chép. Nếu con số là 101, điều đó có nghĩa là có 100 lần không thành công để nhận được câu trả lời đúng ... LOL (j/k ;-)) –

Dưới đây là một giải pháp thành ngữ và performant

df['label'] = np.where(df, df.columns, '').sum(axis=1) 

    A B C label 
0 1 0 0  A 
1 1 1 0 AB 
2 0 1 0  B 
3 0 0 1  C

Nguồn

2017-09-12 22:06:53

điều này rất thanh lịch! – MaxU

Đẹp nhất !! ~ :) – Wen

Hoặc sử dụng melt và groupby

df1 = df.reset_index().melt('index') 
df1 = df1[df1.value==1] 
df['label'] = df1.groupby('index').variable.sum() 
df 

Out[976]: 
    A B C label 
0 1 0 0  A 
1 1 1 0 AB 
2 0 1 0  B 
3 0 0 1  C

Hoặc

df['label'] = df.T.apply(lambda x: ''.join(x.index[x==1]),axis=0) 
df 
Out[984]: 
    A B C label 
0 1 0 0  A 
1 1 1 0 AB 
2 0 1 0  B 
3 0 0 1  C

Nguồn

2017-09-12 22:07:36 Wen

Hoạt động nhưng khá chậm. Bạn thường muốn tránh groupby nếu có thể –

@TedPetrou thấy số thứ hai của tôi :) – Wen

@GiantsLoveDeathMetal sẽ bắt đầu nhận thấy định dạng mã của tôi hôm nay :) – Wen

df = df.assign(label=[''.join([df.columns[n] for n, bool in enumerate(row) if bool]) 
         for _, row in df.iterrows()]) 
>>> df 
    A B C label 
0 1 0 0  A 
1 1 1 0 AB 
2 0 1 0  B 
3 0 0 1  C

Thời gian

# Set-up: 
df_ = pd.concat([df] * 10000) 

%%timeit 
# Solution by @Wen 
df1 = df_.reset_index().melt('index') 
df1 = df1[df1.value==1] 
df['label'] = df1.groupby('index').variable.sum() 
# 10 loops, best of 3: 47.6 ms per loop 

%%timeit 
# Solution by @MaxU 
df_['label'] = df_.apply(lambda x: ''.join(df_.columns[x.astype(bool)].tolist()), axis=1) 
# 1 loop, best of 3: 4.99 s per loop 

%%timeit 
# Solution by @TedPetrou 
df_['label'] = np.where(df_, df_.columns, '').sum(axis=1) 
# 100 loops, best of 3: 12.5 ms per loop 

%%timeit 
# Solution by @Alexander 
df_['label'] = [''.join([df_.columns[n] for n, bool in enumerate(row) if bool]) for _, row in df_.iterrows()] 
# 1 loop, best of 3: 3.75 s per loop 

%%time 
# Solution by @PiRSquared 
df_['label'] = df_.dot(df_.columns) 
# CPU times: user 18.1 ms, sys: 706 µs, total: 18.8 ms 
# Wall time: 18.9 ms

Nguồn

2017-09-12 22:25:44 Alexander

Cũng giống như thời gian. Rất tuyệt. –

Sử dụng dot

df.assign(label=df.dot(df.columns)) 

    A B C label 
0 1 0 0  A 
1 1 1 0 AB 
2 0 1 0  B 
3 0 0 1  C

Cùng một điều sử dụng mảng NumPy tiềm ẩn

df.assign(label=df.values.dot(df.columns.values)) 

    A B C label 
0 1 0 0  A 
1 1 1 0 AB 
2 0 1 0  B 
3 0 0 1  C

Nguồn

2017-09-12 22:46:01 piRSquared

Điều này cũng rất thông minh! – MaxU

'df.dot (df.columns)' rất đẹp. – Alexander

Ồ, tôi không biết bạn có thể nhân số nguyên và đối tượng –

Làm cách nào để có thể ánh xạ tiêu đề tới các cột trong gấu trúc?

Trả lời

Các vấn đề liên quan