2015-05-28 18 views
5

Tôi cố gắng để đọc tập tin CSV vào R. Tôi cố gắng:Trong Quét lỗi EOF khi đọc tệp CSV

data <- read.csv(file="train.csv") 
Warning message: 
In scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : 
    EOF within quoted string 

Nhưng, điều này đọc trong chỉ một tỷ lệ nhỏ trong tổng số quan sát. Sau đó, tôi đã thử xoá dấu ngoặc kép:

data <- read.csv(file="train.csv",quote = "",sep = ",",header = TRUE) 
Error in read.table(file = file, header = header, sep = sep, quote = quote, : 
    more columns than column names 

Vì dữ liệu là văn bản, có vẻ như có một số vấn đề với dấu phân tách.

Rất khó để chia sẻ toàn bộ tập dữ liệu vì nó rất lớn. Tôi đã cố gắng đi đến dòng nơi mà lỗi đến, nhưng dường như không có ký tự không in được. Tôi cũng đã thử những người đọc khác như fread(), nhưng vô ích.

Trả lời

5

Đã gặp phải điều này trước đây. Có thể rất phức tạp. Hãy thử trình đọc CSV chuyên ngành .:

library(readr) 
data <- read_csv(file="train.csv") 

Điều này nên thực hiện.

+0

Đã hoạt động tốt. Rực rỡ! – Zephyr