Tôi có một RDD gọiKhởi tạo một RDD để trống
JavaPairRDD<String, List<String>> existingRDD;
Bây giờ tôi cần phải khởi tạo này existingRDD
để trống để khi tôi nhận được của RDD thực tế tôi có thể làm một liên minh với existingRDD
này. Làm cách nào để khởi tạo existingRDD
cho RDD trống trừ khi khởi tạo nó thành null? Đây là mã của tôi:
JavaPairRDD<String, List<String>> existingRDD;
if(ai.get()%10==0)
{
existingRDD.saveAsNewAPIHadoopFile("s3://manthan-impala-test/kinesis-dump/" + startTime + "/" + k + "/" + System.currentTimeMillis() + "/",
NullWritable.class, Text.class, TextOutputFormat.class); //on worker failure this will get overwritten
}
else
{
existingRDD.union(rdd);
}
Tôi không chắc tôi hoàn toàn hiểu những gì bạn đang cố gắng làm. Bạn muốn tạo một liên minh trên một RDD rỗng? Để làm gì? – eliasah
Có. Khi tôi lặp qua mỗiRDD i có nghĩa là foreachRDD trong mã của tôi tôi cần phải làm công đoàn của rdd của hiện tại nàyRDD để cuối cùng tôi có thể lưu thisRDD này để s3 của tôi –
Tại sao bạn không thể đơn giản đặt 'existingRDD' thành' rdd' trong lần lặp đầu tiên sau khi ghi nó vào s3? –