Trong Scala tôi có thể san bằng một bộ sưu tập sử dụng:Làm thế nào để san bằng một bộ sưu tập với Spark/Scala?
val array = Array(List("1,2,3").iterator,List("1,4,5").iterator)
//> array : Array[Iterator[String]] = Array(non-empty iterator, non-empty itera
//| tor)
array.toList.flatten //> res0: List[String] = List(1,2,3, 1,4,5)
Nhưng làm thế nào tôi có thể thực hiện tương tự trong Spark?
Đọc tài liệu API http://spark.apache.org/docs/0.7.3/api/core/index.html#spark.RDD có vẻ như không phải là phương pháp cung cấp chức năng này?
mặc dù đây là chức năng chính xác, giải pháp này sẽ không được phân phối và sẽ bị tắc nghẽn với người lái xe/người lái. Các giải pháp từ samthebest là tốt hơn nhiều. – ldmtwo
@ user3746632: các cuộc gọi 'collect()' chỉ nhằm mục đích minh họa, để cho thấy rằng, quả thực, kết quả đã được làm phẳng. –