2013-03-12 22 views
10

Tôi đang cố chuyển đổi CSV thành ARFF bằng cách sử dụng CSVLoader của Weka từ GUI. Trong các tùy chọn, tôi đặt ký tự bao vây cho các chuỗi là ", mặc dù không có trích dẫn nào trong tệp của tôi. tôi nhận được lỗi sau:Weka CSVLoader sai số lượng giá trị. Đọc 2, dự kiến ​​23

weka.core.converters.CSVLoaderfailed to lead <my file> 
Reason: 
wrong number of values. Read 2, expected 23, read Token[EOL], line 1763 

Dưới đây là dòng 1762-1764:

450c787001b004af69428e267c7a4ca1,I_need need_to to_go go_back back_to to_my my_live live_food food_diet diet_PPP PPP_Not Not_90% 90%_like like_before before_CCC CCC_but but_I I_bet bet_I I_could could_do do_75% 75%_without without_losing losing_too too_much much_weight weight_PPP PPP_PPP,2.30,3.50,4.50,2.85,4.50,n,y,y,n,y,AM,297,41728.8,95.58,0.03,42826,0.49,0.17,-12.5611111111,0.248945147679,0.0595238095238 
450c787001b004af69428e267c7a4ca1,It's_ugly ugly_here here_PPP PPP_But But_there there_are are_sparks sparks_PPP PPP_PPP PPP_PPPmoments PPPmoments_PPP PPP_Love Love_PPP,2.30,3.50,4.50,2.85,4.50,n,y,y,n,y,AM,297,41728.8,95.58,0.03,42826,0.49,0.17,-15.91,0.299242424242,0.1 
450c787001b004af69428e267c7a4ca1,I_guess guess_it it_all all_depends depends_on on_your your_mood mood_PPP PPP_PPP PPP_PPPwhy PPPwhy_can't can't_these these_meds meds_be be_any any_damn damn_good good_QQQ,2.30,3.50,4.50,2.85,4.50,n,y,y,n,y,AM,297,41728.8,95.58,0.03,42826,0.49,0.17,-12.9970588235,0.0,0.0344827586207 

Bất kỳ ý tưởng? Tôi dường như không thể tìm thấy lỗi.

EDIT--- 

Tất nhiên, ngay sau khi tôi đăng Tôi tìm thấy "lỗi" CSVLoader không thích các ký tự%. Vì vậy, tôi đã thay đổi câu hỏi của tôi: Có ai biết tại sao điều này hoặc những nhân vật khác không thích nó?

+1

thật đáng tiếc khi những người weka không thể thực hiện công việc đọc tệp. – OneSolitaryNoob

Trả lời

13

những nhân vật này thường gây ra vấn đề nếu đang được sử dụng như là dữ liệu

, = " '* + -%

2

Lỗi là do dấu nháy đơn trong dòng 1763.

4

sử dụng mã này trong R ngôn ngữ và thay đổi tệp sẽ giải quyết vấn đề của bạn 100%

mydata=read.csv("train.csv",header=TRUE) 
library("foreign") 
write.arff(x =mydata ,file= "train.arff") 
Các vấn đề liên quan