Gần đây tôi có quyền truy cập vào một lượng lớn dữ liệu nhật ký máy chủ (tại công việc mới). Tôi có một số kinh nghiệm trong việc học máy từ đại học. Dữ liệu nhật ký bao gồm nhật ký máy chủ, nhật ký truy cập cơ sở dữ liệu, v.v. Tôi đã tự hỏi loại học tập nào có thể được thực hiện từ dữ liệu như vậy.Học máy trên dữ liệu nhật ký máy chủ
Một điều nhỏ mà tôi đã thử là dự đoán số lượng yêu cầu vào một giờ nhất định trong ngày dựa trên dữ liệu của tuần trước, điều này có vẻ ổn nhưng điều này không đáng kể. Vì vậy,
- Loại học tập nào có thể được thực hiện từ dữ liệu như vậy?
- Có thể dự đoán xác suất của IP đang thực hiện các nhấp chuột spam lên quảng cáo (có phải công ty là thành công) dựa trên một số mẫu sử dụng của những người gửi spam trước đó không?
- Có thể dự đoán thời điểm lưu lượng truy cập có thể tăng lên.
- Có bất kỳ công cụ/dự án hiện có nào tận dụng không?
- Bất kỳ tài nguyên/giấy tờ thú vị nào nói về nội dung tương tự?
- Ngoài ra, hoạt động của quá trình liên quan đến dữ liệu tại một thời điểm nhất định trên máy chủ. điều này có hữu ích cho việc học không?
cảm ơn! tôi sẽ có một cái nhìn – swair