Tôi có một dataframe với tên cột cấu hình ví dụLàm thế nào để đổi tên tên cột trong spark SQL
Journey channelA channelB channelC
j1 1 0 0
j1 0 1 0
j1 1 0 0
j2 0 0 1
j2 0 1 0
Bằng cách cấu hình tôi có nghĩa là có thể có 'n' kênh trong dataframe.
Bây giờ tôi cần một sự thay đổi trong đó tôi cần phải tìm tổng của tất cả các kênh truyền hình giống như
df.groupBy("Journey").agg(sum("channelA"), sum("channelB"), sum("channelC"))
Kết quả trong số đó sẽ là:
Journey sum(channelA) sum(channelB) sum(channelC)
j1 2 1 0
j2 0 1 1
Bây giờ tôi muốn đổi tên tên cột cho tên gốc và tôi có thể làm điều đó với
.withColumnRenamed("sum(channelA)", channelA)
nhưng như tôi đã đề cập đến kênh danh sách là cấu hình và tôi muốn một tuyên bố cột đổi tên chung để đổi tên tất cả các cột tóm tắt của tôi để các tên cột gốc để có được một dataframe dự kiến như sau:
Journey channelA channelB channelC
j1 2 1 0
j2 0 1 1
gợi ý Bất kỳ cách tiếp cận này