2014-11-15 18 views
5

Tôi đang cố gắng Vowpal Wabbit và đang trong quá trình tìm ra các định dạng tệp cần thiết cho đào tạo và thử nghiệm. Tôi đã làm theo các hướng dẫn từ https://github.com/JohnLangford/vowpal_wabbit/wiki/Tutorial và thấy rằng đây là công tác đào tạo định dạng dữ liệu:Vowpal Wabbit đào tạo và thử nghiệm các định dạng dữ liệu

0 | price:.23 sqft:.25 age:.05 2006 
1 2 'second_house | price:.18 sqft:.15 age:.35 1976 
0 1 0.5 'third_house | price:.53 sqft:.32 age:.87 1924 

Đối với các dữ liệu thử nghiệm, tôi không có nhãn hoặc bất kỳ kết quả đầu ra, nhưng chỉ cần các tính năng. Làm thế nào tôi có thể viết về điều đó? Tôi đã thử chỉ bao gồm các tính năng như vậy:

price:.23 sqft:.25 age:.05 2006 
price:.18 sqft:.15 age:.35 1976 
price:.53 sqft:.32 age:.87 1924 

Nhưng, điều đó mang lại cho tôi ngoại lệ vì đó không phải là định dạng phù hợp. Tôi cũng đã thử những điều sau đây và tất cả cung cấp cho tôi chỉ 0 là kết quả:

| price:.23 sqft:.25 age:.05 2006 
| price:.18 sqft:.15 age:.35 1976 
| price:.53 sqft:.32 age:.87 1924 

0 0 0 | price:.23 sqft:.25 age:.05 2006 
0 0 0 | price:.18 sqft:.15 age:.35 1976 
0 0 0 | price:.53 sqft:.32 age:.87 1924 

Bất kỳ định dạng nào tôi nên nhắm đến, chỉ biết các tính năng? Cảm ơn đã giúp đỡ.

Trả lời

6

Biểu tượng thanh (|) phải còn ở định dạng cho dự đoán:

| price:.23 sqft:.25 age:.05 2006 
| price:.18 sqft:.15 age:.35 1976 
| price:.53 sqft:.32 age:.87 1924 

Nếu bạn không bao gồm các nhãn đúng, vw không thể tính toán sự mất mát kiểm tra, tất nhiên. Để nhận dự đoán, hãy sử dụng vw -d test_set.vw -t -p predictions.txt. Tập huấn luyện trong hướng dẫn (chỉ với ba ví dụ) là quá nhỏ để đào tạo bất kỳ mô hình hợp lý nào.

+0

Cảm ơn Martin. Quy tắc dễ nhớ: suy nghĩ về ký hiệu '|' bên trái trong mỗi dòng ví dụ, như dấu phân cách giữa 1) những gì bạn muốn dự đoán (có thể trống) ở bên trái và 2) những gì được biết (tính năng đầu vào), Phía bên phải. – arielf

+0

Làm cách nào để tải một mô hình hiện có mà tôi đã xuất ra trong khi đào tạo? Những gì tôi muốn là sử dụng mô hình đã nói cũng như một số dữ liệu thử nghiệm để đưa ra các dự đoán cho một tệp. – intl

+1

@intl Như được mô tả trong https://github.com/JohnLangford/vowpal_wabbit/wiki/Hướng dẫn 'vw -i house.model -t -d test.data -p predictions' –

Các vấn đề liên quan