2013-08-08 40 views
5

tôi đã được sử dụng SVM phân loại với các dữ liệu sauWeka: Làm thế nào để chuẩn bị tập kiểm tra trong WEKA

@relation whatever 

@attribute mfe numeric 
@attribute GB numeric 
@attribute GTB numeric 
@attribute Seeds numeric 
@attribute ABP numeric 
@attribute AU_Seed numeric 
@attribute GC_Seed numeric 
@attribute GU_Seed numeric 
@attribute UP numeric 
@attribute AU numeric 
@attribute GC numeric 
@attribute GU numeric 
@attribute A-U_L numeric 
@attribute G-C_L numeric 
@attribute G-U_L numeric 
@attribute (G+C) numeric 
@attribute MFEi1 numeric 
@attribute MFEi2 numeric 
@attribute MFEi3 numeric 
@attribute MFEi4 numeric 
@attribute dG numeric 
@attribute dP numeric 
@attribute dQ numeric 
@attribute dD numeric 
@attribute Outcome {Yes,No} 


@data 
-24.3,1,18,2,9,4,3,0.5,8,10,7,1,0.454545455,0.318181818,0.045454545,7,-0.157792208,-0.050206612,-1.104545455,-1.35,-1.104545455,0,0,0,Yes 
-24.8,2,15,2,7.5,2,3,1,7,5,8,2,0.208333333,0.333333333,0.083333333,8,-0.129166667,-0.043055556,-0.516666667,-1.653333333,-1.033333333,0,0,0,No 
-24.4,1,16,3,5.333333333,1.666666667,2.666666667,1,4,5,8,3,0.217391304,0.347826087,0.130434783,8,-0.132608696,-0.046124764,-1.060869565,-1.525,-1.060869565,0,0,0,Yes 
-24.2,1,18,2,9,2,2.5,1,10,5,11,2,0.227272727,0.5,0.090909091,11,-0.1,-0.05,-1.1,-1.344444444,-1.1,0,0,0,Yes 
-24.5,3,17,2,8.5,2,3,1,5,6,9,2,0.272727273,0.409090909,0.090909091,9,-0.123737374,-0.050619835,-0.371212121,-1.441176471,-1.113636364,-0.12244898,0,0,Yes 

Đây là tập huấn luyện của tôi. Và trong này được xác định của nó cho dù dữ liệu của tôi là có lớp hoặc không có lớp. Câu hỏi của tôi là dữ liệu thử nghiệm của tôi là từ nguồn không xác định và tôi không có ý tưởng về lớp đó thuộc về nó. vì vậy làm thế nào để chuẩn bị bộ thử nghiệm của tôi. mà không có thuộc tính kết quả, weka đang đưa ra "dấu hiệu: Dữ liệu không khớp". Làm thế nào để chuẩn bị bộ kiểm tra? để tách biến của tôi thành lớp Có và nO bằng SVM.

+1

Nếu bộ dữ liệu thử nghiệm của bạn không có nhãn cho từng trường hợp, bạn sẽ kiểm tra những gì? Mỗi cá thể thử nghiệm phải có nhãn mặt đất, nếu không bạn sẽ không thể biết liệu phân loại có đúng hay không. – stackoverflowuser2010

Trả lời

8

bước để chuẩn bị tập kiểm tra:

  1. Tạo một tập huấn luyện ở định dạng CSV.
  2. Đồng thời tạo bộ thử nghiệm ở định dạng CSV với cùng số không. thuộc tính và cùng loại.
  3. Sao chép tập kiểm tra và dán vào cuối tập huấn luyện và lưu dưới dạng tệp CSV mới.
  4. Nhập tệp CSV đã lưu ở bước 3 bằng cách sử dụng Weka >> Explorer >> Preprocess.
  5. Trong tùy chọn bộ lọc Chọn bộ lọc >> không giám sát >> trường hợp >> Xóa phạm vi.
  6. Nhấp vào nguồn cấp dữ liệu cho biết RemoveRange-R trước tiên.
  7. Chỉ định phạm vi bạn muốn xóa, dữ liệu đào tạo có 100 giá trị, sau đó chọn đầu tiên-100 và Áp dụng bộ lọc.
  8. Lưu dưới dạng tệp Arff và điều này có thể được sử dụng làm bộ thử nghiệm.
  9. Sau đó, áp dụng bộ này. Nếu bạn vẫn gặp bất kỳ lỗi nào, hãy viết thư trả lời cho bài đăng này.
+1

Đẹp nhất :) rất hữu ích :) –

+1

Tôi có thể tạo một bộ thử nghiệm với một số thuộc tính khác không? – UserK

2

Nếu bạn không muốn trải qua sự phức tạp, bạn có thể chuẩn bị bộ thử nghiệm với tên chính xác, loại dữ liệu và phạm vi dữ liệu như trong tập huấn luyện của bạn và tất nhiên với các giá trị thuộc tính. Thuộc tính lớp sẽ có mặt nhưng giá trị phải là dấu chấm hỏi (?). Ví dụ: để chuyển đổi bộ đào tạo đã cho thành bộ thử nghiệm, thay đổi sau có thể được thực hiện `@ mối quan hệ bất cứ điều gì

@relation whatever-TEST 

    @attribute mfe numeric 
    @attribute GB numeric 
    @attribute GTB numeric 
    @attribute Seeds numeric 
    @attribute ABP numeric 
    @attribute AU_Seed numeric 
    @attribute GC_Seed numeric 
    @attribute GU_Seed numeric 
    @attribute UP numeric 
    @attribute AU numeric 
    @attribute GC numeric 
    @attribute GU numeric 
    @attribute A-U_L numeric 
    @attribute G-C_L numeric 
    @attribute G-U_L numeric 
    @attribute (G+C) numeric 
    @attribute MFEi1 numeric 
    @attribute MFEi2 numeric 
    @attribute MFEi3 numeric 
    @attribute MFEi4 numeric 
    @attribute dG numeric 
    @attribute dP numeric 
    @attribute dQ numeric 
    @attribute dD numeric 
    @attribute Outcome {Yes,No} 


    @data 
    -24.3,1,18,2,9,4,3,0.5,8,10,7,1,0.454545455,0.318181818,0.045454545,7,-0.157792208,-0.050206612,-1.104545455,-1.35,-1.104545455,0,0,0,? 
    -24.8,2,15,2,7.5,2,3,1,7,5,8,2,0.208333333,0.333333333,0.083333333,8,-0.129166667,-0.043055556,-0.516666667,-1.653333333,-1.033333333,0,0,0,? 
    -24.4,1,16,3,5.333333333,1.666666667,2.666666667,1,4,5,8,3,0.217391304,0.347826087,0.130434783,8,-0.132608696,-0.046124764,-1.060869565,-1.525,-1.060869565,0,0,0,? 
    -24.2,1,18,2,9,2,2.5,1,10,5,11,2,0.227272727,0.5,0.090909091,11,-0.1,-0.05,-1.1,-1.344444444,-1.1,0,0,0,? 
    -24.5,3,17,2,8.5,2,3,1,5,6,9,2,0.272727273,0.409090909,0.090909091,9,-0.123737374,-0.050619835,-0.371212121,-1.441176471,-1.113636364,-0.12244898,0,0,? 

` 
+0

Hi Rushdi, như bạn đã viết tôi đã thay thế lớp học với? nhưng trong "Output Classifier" tôi chỉ có giá trị 0 và NaN. Tôi nên làm gì? – adev

+0

@adev, nếu bạn muốn đánh giá, bạn phải biết nhãn của các điểm dữ liệu. nếu không, bạn sẽ thấy NaN vì mô hình dự đoán nhãn nhưng '?' trong các dữ liệu giới hạn nó so sánh các dự đoán với sự thật mặt đất. –

Các vấn đề liên quan