2016-11-05 20 views
5

Tôi có thể lọc - theo các bộ dữ liệu bên dưới trong RDD bằng cách sử dụng "chứa". Nhưng những gì về lọc một RDD bằng cách sử dụng "không chứa"?Scala Spark chứa so với không chứa

val rdd2 = rdd1.filter(x => x._1 contains ".") 

Tôi không thể tìm thấy cú pháp cho việc này. Giả sử có thể và tôi không sử dụng DataFrame s. Tôi không thể nhìn thấy từ làm thế nào để làm điều đó với các ví dụ về regex và/hoặc bộ lọc.

+0

Một chút giàu chỉnh sửa bài viết của tôi – thebluephantom

Trả lời

11

Nó chỉ là phủ của vị contains lọc:

val rdd2 = rdd1.filter(x => !(x._1 contains ".")) 
+0

Cảm ơn, một trường hợp của rừng cây! – thebluephantom

+0

Không chắc chắn cách bạn chấp nhận. – thebluephantom

Các vấn đề liên quan