Thuật toán hồi quy dường như đang hoạt động trên các đối tượng được trình bày dưới dạng số. Ví dụ:Phân tích hồi quy tuyến tính với các tính năng chuỗi/phân loại (biến)?
bộ dữ liệu này không có các tính năng phân loại/biến. Nó khá rõ ràng làm thế nào để làm hồi quy về dữ liệu này và dự đoán giá cả.
Nhưng bây giờ tôi muốn làm phân tích hồi quy trên dữ liệu đó có các tính năng phân loại:
Có các tính năng: District
, Condition
, Material
, Security
, Type
Làm cách nào để tôi có thể thực hiện hồi quy trên dữ liệu này? Tôi có phải chuyển tất cả dữ liệu chuỗi/phân loại này thành số theo cách thủ công không? Tôi có nghĩa là nếu tôi phải tạo một số quy tắc mã hóa và theo quy tắc đó, chuyển đổi tất cả dữ liệu thành giá trị số. Có cách nào đơn giản để chuyển đổi dữ liệu chuỗi thành các số mà không phải tạo quy tắc mã hóa riêng theo cách thủ công không? Có thể có một số thư viện trong số Python có thể được sử dụng cho điều đó? Có một số rủi ro mà mô hình hồi quy sẽ bằng cách nào đó không chính xác do "mã hóa xấu"?
Nhưng làm thế nào có thể hotencoding giúp đỡ bạn khi bạn sẽ cố gắng để dự đoán một màu mới? Có thể trong trường hợp của bạn, bạn phải đào tạo lại mô hình. Bạn có giải pháp nào không? – gtzinos