Tôi đang cố gắn thêm tên tệp vào mỗi bản ghi trong tệp. Tôi nghĩ rằng nếu RDD là Array nó sẽ được dễ dàng cho tôi để làm điều đó.Làm thế nào để chuyển đổi RDD [(String, String)] thành RDD [Array [String]]?
Một số trợ giúp chuyển đổi loại RDD hoặc giải quyết vấn đề này sẽ được nhiều người đánh giá cao!
Trong (String, String) gõ
scala> myRDD.first()(1)
scala><console>:24: error: (String, String) does not take parametersmyRDD.first()(1)
Trong Mảng (string)
scala> myRDD.first()(1)
scala> res1: String = abcdefgh
chức năng của tôi:
def appendKeyToValue(x: Array[Array[String]){
for (i<-0 to (x.length - 1)) {
var key = x(i)(0)
val pattern = new Regex("\\.")
val key2 = pattern replaceAllIn(key1,"|")
var tempvalue = x(i)(1)
val finalval = tempvalue.split("\n")
for (ab <-0 to (finalval.length -1)){
val result = (I am trying to append filename to each record in the filekey2+"|"+finalval(ab))
}
}
}
Cả hai câu trả lời cung cấp giải pháp cho sự truy vấn của tôi. Chúc mừng! – WoodChopper
Vui vì tôi có thể giúp :-) –