Tôi đang viết một hàm do người dùng định nghĩa sẽ lấy tất cả các cột ngoại trừ cột đầu tiên trong một khung dữ liệu và tổng (hoặc bất kỳ thao tác nào khác). Giờ đây, khung dữ liệu đôi khi có thể có 3 cột hoặc 4 cột trở lên. Nó sẽ thay đổi.Pyspark: Vượt qua nhiều cột trong UDF
Tôi biết tôi có thể mã cứng 4 tên cột như vượt qua trong UDF nhưng trong trường hợp này nó sẽ khác nhau vì vậy tôi muốn biết làm thế nào để hoàn thành nó?
Dưới đây là hai ví dụ trong ví dụ đầu tiên, chúng tôi có hai cột để thêm vào và cột thứ hai sẽ có thêm ba cột.
Cũng hoạt động trong Scala: 'myUdf (mảng ($" col1 ", $" col2 "))' –
cách nó có thể được triển khai cho các cột có các loại khác nhau? – constructor
@constructor, bạn có thể sử dụng 'mảng' nếu tổng số các loại khác nhau (ví dụ: số nguyên và double -> cả hai sẽ được đúc thành gấp đôi) – Mariusz