Tôi đang sử dụng Spark 1.3.0 và Spark Avro 1.0.0. Tôi đang làm việc từ the example on the repository page. Mã sau đây hoạt động tốtBộ lọc tia lửa DataFrame trên chuỗi chứa
val df = sqlContext.read.avro("src/test/resources/episodes.avro")
df.filter("doctor > 5").write.avro("/tmp/output")
Nhưng nếu tôi cần xem chuỗi doctor
có chứa chuỗi con không? Vì chúng ta đang viết biểu thức của chúng ta bên trong một chuỗi. Tôi phải làm gì để thực hiện "chứa"?
là mã scala ở trên? có vẻ như scala không thích ký hiệu $. Tôi đã nhập 'import org.apache.spark.sql.functions.lit' –
Scala. Để thực hiện công việc '$', bạn sẽ cần 'import sqlContext.implicits._'. Bạn cũng có thể thay thế nó bằng 'df (" foo ")' hoặc 'org.apache.spark.sql.functions.col (" foo ")'. – zero323
tuyệt vời! cảm ơn rất nhiều –