Tôi có RDD với NHANY cột (ví dụ: hàng trăm), làm cách nào để thêm một cột nữa vào cuối RDD này?Làm cách nào để thêm cột mới vào Spark RDD?
Ví dụ, nếu RDD của tôi là như dưới đây:
123, 523, 534, ..., 893
536, 98, 1623, ..., 98472
537, 89, 83640, ..., 9265
7297, 98364, 9, ..., 735
......
29, 94, 956, ..., 758
làm thế nào tôi có thể thêm một cột với nó, có giá trị là tổng của các cột thứ hai và thứ ba?
Cảm ơn bạn rất nhiều.
Lưu ý rằng dataframes là không thay đổi. Bạn không thể thay đổi một cái, nhưng bạn có thể tạo một cái mới từ cái cũ ... xem http://stackoverflow.com/questions/29109916/updating-a-dataframe-column-in-spark – Paul