Tôi đang cố gắng đọc tệp csv vào một khung dữ liệu. Tôi biết những gì các giản đồ của dataframe của tôi nên được kể từ khi tôi biết tập tin csv của tôi. Ngoài ra tôi đang sử dụng gói csv tia lửa để đọc các tập tin. Tôi cố gắng để xác định lược đồ như dưới đây.Cung cấp lược đồ khi đọc tệp csv dưới dạng một khung dữ liệu
val pagecount = sqlContext.read.format("csv")
.option("delimiter"," ").option("quote","")
.option("schema","project: string ,article: string ,requests: integer ,bytes_served: long")
.load("dbfs:/databricks-datasets/wikipedia-datasets/data-001/pagecounts/sample/pagecounts-20151124-170000")
Nhưng khi tôi kiểm tra giản đồ của khung dữ liệu tôi đã tạo, có vẻ như đã lấy lược đồ riêng của nó. Tôi có làm gì sai không? làm thế nào để làm cho tia lửa để nhận các lược đồ tôi đã đề cập?
> pagecount.printSchema
root
|-- _c0: string (nullable = true)
|-- _c1: string (nullable = true)
|-- _c2: string (nullable = true)
|-- _c3: string (nullable = true)
phiên bản spark bạn đang sử dụng? –