Tôi đã cố gắng tải một csv vào R để xử lý một số nhưng tôi đang đối mặt với một vấn đề lạ khi cố đọc dữ liệu.Đầu ra cho read.csv()
Các doesnt csv có bất kỳ tiêu đề và tôi đang sử dụng mã đơn giản sau đây để đọc dữ liệu
newClick <- read.csv("test.csv", header = F)
Và sau đây là các tập dữ liệu mẫu:
10000011791441224671,V_Display,exit
10000011951441812316,V_Display,exit
10000013211441319797,V_Display,exit
1000001331441725509,V_Display,exit
10000013681418242863,C_GoogleNonBrand,V_Display,V_Display,V_Display,V_Display,_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,exit
10000014031441295393,V_Display,exit
Kết quả cho dữ liệu hạnh phúc này khung dữ liệu dự kiến của 6 obs. của 18 biến.
Tuy nhiên, đây là phần phức tạp. Nếu tôi thêm một hàng khác trong tập dữ liệu như
10000011791441224671,V_Display,exit
10000011951441812316,V_Display,exit
1000000191441228436,V_Display,exit
10000013211441319797,V_Display,exit
1000001331441725509,V_Display,exit
10000013681418242863,C_GoogleNonBrand,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,V_Display,exit
10000014031441295393,V_Display,exit
Kết quả đầu ra cho điều này là một biến lạ của 3 biến. Trên phân tích chặt chẽ, tôi nhận ra rằng toàn bộ hàng cuối cùng thứ hai đã được chia thành 6 hàng với ba cột mỗi cái là lạ.
Bất kỳ suy nghĩ nào về điều này?
Từ '? Read.table':' Số cột dữ liệu được xác định bằng cách xem năm dòng đầu vào đầu tiên (hoặc toàn bộ đầu vào nếu nó có ít hơn năm dòng) hoặc từ độ dài ' col.names 'nếu nó được chỉ định và dài hơn'. – nicola
@Nicola Cảm ơn Khi bạn nhận được quyền cơ bản, thật dễ dàng để tạo ra phần còn lại của hình ảnh. – hbabbar