2010-04-03 30 views
5

Khi tạo một tệp đào tạo libsvm, làm thế nào để bạn phân biệt giữa một thuộc tính danh nghĩa câu một thuộc tính số? Tôi đang cố gắng để mã hóa một số thuộc tính danh nghĩa như số nguyên, nhưng tôi muốn đảm bảo libsvm không hiểu sai chúng như là các giá trị số. Thật không may, trang web của libsvm dường như có rất ít tài liệu. Pentaho's docs dường như ngụ ý libsvm làm cho sự khác biệt này, nhưng tôi vẫn chưa rõ nó được tạo ra như thế nào.Thuộc tính danh nghĩa trong LibSVM

Trả lời

9

Đừng làm điều nàyI'm trying to encode certain nominal attributes as integers.

Thay vào đó, hãy sử dụng một tính năng nhị phân riêng cho từng giá trị của từng thuộc tính danh nghĩa.

Cách thức SVM được xây dựng, tất cả thuộc tính/tính năng là nhãn số và lớp là danh nghĩa. Các thuộc tính danh nghĩa về cơ bản là giả mạo bằng cách sử dụng các tính năng nhị phân loại trừ lẫn nhau.

0

Tôi nghĩ bạn không thể làm điều đó trong libsvm, weka hoặc SVM-light. Một cách tiếp cận mà bạn có thể sử dụng là sử dụng một cái gì đó giống như cây quyết định cho thuộc tính danh nghĩa của bạn và svm hoặc bất kỳ trình phân loại dựa trên khoảng cách nào cho thuộc tính số của bạn và sau đó kết hợp các kết quả. Tôi hy vọng nó sẽ giúp.

Các vấn đề liên quan