Tôi cần khung dữ liệu kết quả trong dòng bên dưới, để có tên bí danh "maxDiff" cho cột tối đa ('diff') sau groupBy. Tuy nhiên, các dòng dưới đây không makeany thay đổi, cũng không ném một lỗi.Bí danh cột sau groupBy trong pyspark
grpdf = joined_df.groupBy(temp1.datestamp).max('diff').alias("maxDiff")
có .. hoạt động này .. ngoại trừ func đó. không yêu cầu – mhn
không phải là nếu bạn đã nhập 'pyspark.sql.functions' vào tập lệnh – Nhor