val lines: RDD[String] = sc.textFile("/tmp/inputs/*")
val tokenizedLines = lines.map(Tokenizer.tokenize)
trong đoạn mã trên, hàm tokenize có thể trả về chuỗi rỗng. Làm cách nào để bỏ qua việc thêm nó vào bản đồ trong trường hợp đó? hoặc xóa các bài viết trống khi thêm vào bản đồ?Xóa chuỗi trống khỏi bản đồ trong scala
không lọc này kết quả hoặc loại bỏ chúng? Tôi muốn loại bỏ chúng. – Siva
Bộ lọc trả về bộ sưu tập mới không có chuỗi trống. – akagroundhog
khi tôi in các dòng bài đăng đã được mã hóa, nó vẫn có các chuỗi rỗng trong bộ đệm mảng. Tôi đang thiếu một cái gì đó bổ sung? – Siva