Tôi có một vài tập dữ liệu từ các khoảng thời gian tương tự. Đó là bài thuyết trình của mọi người vào ngày đó, khoảng thời gian khoảng một năm. Dữ liệu không được thu thập đều đặn, nó khá ngẫu nhiên: 15-30 mục cho mỗi năm, từ 5 năm khác nhau.Dự đoán từ ngày trước: dữ liệu giá trị
Biểu đồ được vẽ từ dữ liệu cho mỗi năm trông gần như thế này: Đồ thị được làm bằng matplotlib. Tôi có dữ liệu ở định dạng datetime.datetime, int
.
Có thể dự đoán, theo bất kỳ cách nào hợp lý, mọi thứ sẽ diễn ra như thế nào trong tương lai? Suy nghĩ ban đầu của tôi là tính trung bình từ tất cả các lần xuất hiện trước đó và dự đoán nó sẽ là thế này. Điều đó, tuy nhiên, không xem xét bất kỳ dữ liệu nào từ năm hiện tại (nếu nó cao hơn mức trung bình mọi lúc, thì có thể đoán là có thể cao hơn một chút).
Tập dữ liệu và kiến thức thống kê của tôi bị giới hạn, vì vậy mọi thông tin chi tiết đều hữu ích. Mục tiêu của tôi là đầu tiên tạo ra một giải pháp nguyên mẫu, để thử xem liệu dữ liệu của tôi có đủ cho những gì tôi đang cố gắng thực hiện và sau khi xác thực (tiềm năng), tôi sẽ thử một cách tiếp cận tinh tế hơn không.
Chỉnh sửa: Rất tiếc, tôi chưa bao giờ có cơ hội thử các câu trả lời tôi nhận được! Tôi vẫn tò mò mặc dù loại dữ liệu đó là đủ và sẽ ghi nhớ điều này nếu tôi có cơ hội. Cảm ơn bạn vì tất cả các câu trả lời.
câu hỏi này không thực sự về mã, về toán học, bạn xác định dự đoán theo nghĩa này như thế nào? và cách toán học trên loại đường cong/đồ thị này là gì? tôi không nghĩ đây là nơi thích hợp cho câu hỏi này. –
@Inbar Tôi biết rằng điều này không hoàn toàn phù hợp với phần mã, nhưng đó là góc duy nhất tôi đang tiếp cận từ này. Tôi tin tưởng rằng mọi người ở đây có đủ chuyên môn để cung cấp cho tôi một hướng giải pháp. – schme
Câu hỏi này sẽ phù hợp hơn trên http://stats.stackexchange.com/ –