Tôi thấy một giải pháp ở đây nhưng khi tôi thử nó không hiệu quả với tôi.Thay thế các giá trị null trong Spark DataFrame
Trước tiên tôi nhập khẩu một tập tin cars.csv:
val df = sqlContext.read
.format("com.databricks.spark.csv")
.option("header", "true")
.load("/usr/local/spark/cars.csv")
nào trông giống như sau:
+----+-----+-----+--------------------+-----+
|year| make|model| comment|blank|
+----+-----+-----+--------------------+-----+
|2012|Tesla| S| No comment| |
|1997| Ford| E350|Go get one now th...| |
|2015|Chevy| Volt| null| null|
Sau đó, tôi làm điều này:
df.na.fill("e",Seq("blank"))
Nhưng các giá trị null didn không thay đổi.
Có ai có thể giúp tôi không?
Những tuyên bố 'df.na.fill ("e", Seq ("blank")) 'trả về một mới' DataFrame' để 'df' sẽ không được sửa đổi. Bạn có gán nó vào một 'DataFrame' mới không? –
Cảm ơn! Tôi đạt được rồi! –