Có cách nào để ghép các bộ dữ liệu của hai số khác nhau RDD
s trong tia lửa không?Kết hợp các tập dữ liệu của các RDD khác nhau trong tia lửa Apache bằng cách sử dụng scala
Yêu cầu là - tôi tạo hai RDD trung gian bằng cách sử dụng scala có cùng tên cột, cần phải kết hợp các kết quả này của cả RDD và lưu kết quả để truy cập vào giao diện người dùng. Làm cách nào để kết hợp các bộ dữ liệu ở đây?
RDDs là loại spark.sql.SchemaRDD
Bạn không thể sử dụng '++'? – lmm
@lmm No .. Nó sẽ thêm cột vào RDD. Tôi cần thêm hàng vào RDD. Tôi có hai RDD với cùng cột mà các bản ghi cần được hợp nhất vào một RDD duy nhất. – Atom
Không, tôi chỉ thử nó để chắc chắn. '++' tạo ra một RDD công đoàn với các kết quả từ cả hai. – lmm