Tôi đang làm việc trên một dự án và tôi có một tập con dữ liệu thời gian đột quỵ của người dùng. Điều này có nghĩa là người dùng thực hiện n lần thử và tôi sẽ sử dụng dữ liệu thời gian cố gắng đã ghi trong các loại thuật toán phân loại khác nhau xác minh rằng quá trình đăng nhập được thực hiện bởi người dùng hoặc một người khác. (Đơn giản là tôi có thể nói rằng đây là sinh trắc học)cách tốt nhất để tạo dữ liệu giả cho vấn đề phân loại là gì?
Tôi có 3 lần khác nhau của quá trình đăng nhập người dùng đăng nhập, ofcourse đây là tập con của dữ liệu vô hạn.
cho đến bây giờ nó là một vấn đề phân loại dễ dàng, tôi quyết định sử dụng WEKA nhưng theo như tôi hiểu tôi phải tạo một số dữ liệu giả để nuôi thuật toán phân loại.Kết quả đo của người dùng sẽ là 1 và dữ liệu giả sẽ là 0 .
tôi có thể sử dụng một số thuật toán tối ưu hóa không? hoặc là có cách nào để tạo ra dữ liệu giả này để có được tối thiểu dương tính giả?
Cảm ơn
cảm ơn câu trả lời Daniel. Sau khi tôi hiểu được điểm của bạn, tôi sẽ đăng bài ở đây để được trợ giúp. – berkay
Chắc chắn, hãy cho tôi biết nếu có bất cứ điều gì cần được xây dựng. Nếu bạn tìm thấy câu trả lời này hoặc những câu trả lời khác hữu ích hoặc mang tính thông tin, hãy chắc chắn bỏ phiếu cho họ và chọn một câu trả lời cho câu hỏi được chấp nhận. – dmcer