Tôi đang cố gắng xử lý dữ liệu sinh học để đào tạo mạng nơron và mặc dù một bản trình bày tìm kiếm và lặp đi lặp lại rộng rãi về các phương pháp chuẩn hóa khác nhau mà tôi không nên sử dụng khi nào. Đặc biệt, tôi có một số biến đầu vào được xáo trộn tích cực và đã cố gắng xác định xem có một phương pháp chuẩn hóa thích hợp nhất hay không.Phương pháp chuẩn hóa/chuyển đổi phù hợp nhất cho các tính năng bị lệch?
Tôi cũng lo lắng về việc liệu bản chất của các đầu vào này có ảnh hưởng đến hiệu suất của mạng hay không và như vậy đã thử nghiệm với các phép biến đổi dữ liệu (đặc biệt là chuyển đổi nhật ký). Tuy nhiên, một số đầu vào có nhiều số 0 nhưng cũng có thể có giá trị thập phân nhỏ và dường như bị ảnh hưởng bởi nhật ký (x + 1) (hoặc bất kỳ số nào từ 1 đến 0,0000001 cho vấn đề đó). bị lệch hoặc trở thành lưỡng cực với một đỉnh nhọn ở giá trị min).
Điều này có liên quan đến mạng thần kinh không? I E. sao tôi nên sử dụng các tính năng chuyển đổi/chuẩn hóa tính năng cụ thể để tính toán dữ liệu bị lệch hoặc tôi nên bỏ qua nó và chọn một phương pháp chuẩn hóa và thúc đẩy?
Bất kỳ lời khuyên nào về vấn đề này sẽ được đánh giá rất nhiều!
Cảm ơn!
Về điều kiện kiểm tra chuẩn hóa, tôi đã thử chạy một số tập dữ liệu bằng MSVMPack và tôi nhận được kết quả sau: ** Cột của ma trận dữ liệu hiển thị chênh lệch lớn ** giữa độ lệch chuẩn của chúng (> 10). ** Điều này có thể ảnh hưởng đến hiệu suất của trình phân loại. Bạn có muốn dữ liệu được chuẩn hóa ([y]/n) không? – soufanom