2013-02-16 38 views
8

Bạn là một chiếc máy bay đang theo dõi một con tàu đối phương đi qua đại dương, vì vậy bạn đã thu thập được một loạt các tọa độ (x, y, thời gian) của con tàu. Bạn biết rằng một tàu ngầm ẩn đi với tàu để bảo vệ nó, nhưng trong khi có mối tương quan giữa các vị trí của họ, tàu ngầm thường đi ra khỏi tàu, vì vậy trong khi nó thường gần nó, nó cũng có thể ở phía bên kia của đôi khi thế giới. Bạn muốn dự đoán con đường của tàu ngầm, nhưng tiếc là nó được ẩn khỏi bạn.Thuật toán học máy nào phù hợp để dự đoán một chuỗi thời gian từ một chuỗi khác?

Nhưng một tháng vào tháng bạn nhận thấy tàu ngầm quên để ẩn thân, vì vậy bạn có một loạt các tọa độ cho cả các tàu ngầm và tàu suốt 1.000 chuyến. Sử dụng dữ liệu này, bạn muốn xây dựng một mô hình để dự đoán con đường ngầm của tàu ngầm ẩn chỉ cho các chuyển động của tàu. Các đường cơ sở ngây thơ sẽ là để nói "vị trí tàu ngầm đoán =" vị trí hiện tại của tàu "nhưng từ các dữ liệu tháng tư nơi tàu ngầm đã được nhìn thấy, bạn nhận thấy có một xu hướng cho tàu ngầm để được phía trước của tàu một chút, do đó," vị trí tàu ngầm đoán = vị trí của tàu trong 1 phút "là một ước tính tốt hơn nữa. Hơn nữa, dữ liệu tháng Tư cho thấy khi tàu dừng lại trong nước trong một thời gian dài, tàu ngầm có thể sẽ đi xa tuần tra các vùng nước ven biển.

Bạn sẽ xây dựng mô hình này như thế nào, cho dữ liệu tháng tư dưới dạng dữ liệu đào tạo, để dự đoán đường dẫn của tàu ngầm? x tọa độ "," là tàu chở hàng nhàn rỗi trong 1 ngày ", v.v ... và sau đó có R tìm ra trọng số và thực hiện xác thực chéo. Nhưng tôi thực sự thích cách tự động tạo các yếu tố này từ dữ liệu tháng Tư. Ngoài ra, một mô hình sử dụng trình tự hoặc thời gian sẽ tốt đẹp, vì hồi quy tuyến tính không và tôi nghĩ nó có liên quan.

Chỉnh sửa: Tôi đã cải cách vấn đề bằng câu chuyện được tạo nên nó ít khó hiểu hơn. Vấn đề ban đầu tôi đăng là:

Tôi có dữ liệu mắt theo dõi trên hai đối tượng - một giáo viên, và học sinh. Nó ở dạng (x, y, thời gian), do đó, có một loạt những điều này cho mỗi chủ đề. Những gì giáo viên nhìn vào ảnh hưởng đến những gì học sinh nhìn vào. Tôi sẽ sử dụng phương pháp nào để dự đoán những gì học sinh đang xem, chỉ sử dụng dữ liệu của giáo viên? Cho phép nói rằng tôi có thể đào tạo một số thuật toán học tập bằng cách sử dụng một bộ tiêu chuẩn vàng của dữ liệu học sinh và giáo viên.

Tôi đã suy nghĩ mô hình Markov ẩn sẽ là thích hợp, đưa ra định nghĩa trong Wikipedia, nhưng tôi không chắc chắn làm thế nào để đặt này vào thực tế trên bộ dữ liệu của tôi.

Chi tiết khác: Tôi có dữ liệu về cách giáo viên và học sinh nhìn vào bản đồ và một số bài đọc. Tôi có 40 bộ dữ liệu, trông giống như [(366,234,0), (386,234,5), ...] có nghĩa là giáo viên đã xem xét điểm (366,234) tại thời điểm 0 và sau đó 5 giây sau đó chuyển lên để xem tọa độ (386, 234). Tôi có thể tìm hiểu một mô hình để hiểu mối quan hệ giữa cách một giáo viên nhìn vào nội dung, để dự đoán cách một học sinh sẽ xem xét cùng một nội dung. Vì vậy, có thể học sinh xem nội dung theo thứ tự như giáo viên nhưng chậm hơn. Hoặc có lẽ học sinh không nhìn xung quanh nhiều nhưng giáo viên sẽ quét nhiều nội dung hơn. Tôi có cả hai bộ dữ liệu và muốn xem mức độ chính xác của một mô hình mà tôi có thể nhận được - liệu tôi có thể dự đoán hành vi tìm kiếm của học sinh trong phạm vi 50px hành vi tìm kiếm của giáo viên không?

+0

Dường như mỗi phiên của "bản đồ-nhìn" có thể được coi như là một đồ thị có hướng G (V, E) trong đó mỗi câu của Đỉnh là một (x, y) tọa độ nơi ánh mắt được hướng dẫn nhiều hơn một khoảng thời gian ngưỡng (điểm quan tâm trên bản đồ). Cạnh E thể hiện chuyển động của mắt cũng như sắp xếp thời gian theo hướng của chúng. Vì vậy, với biểu đồ của giáo viên, bạn cần tìm biểu đồ của học sinh. Đúng không? Nếu có, thì bạn có thể đơn giản hóa dữ liệu đào tạo thành các biểu đồ như vậy và tìm hiểu các tham số của chúng. Hoặc: cho điểm (x, y) giáo viên đang xem, bạn cần đoán (x, y) nơi học sinh đang tìm kiếm? –

+0

Alptigin, có đó là chính xác những gì tôi đang cố gắng để làm. Mặc dù cũng có một chiều thời gian cho đồ thị tôi đoán. Bạn có biết cách nào để đào tạo một cái gì đó để tạo ra một đồ thị sinh viên từ một đồ thị giáo viên? – user2077851

+0

Vâng, tôi muốn nói trước hết hãy đơn giản hóa tập dữ liệu của bạn thành các biểu đồ này, trực quan hóa chúng. Tôi không thể nói chính xác phương pháp cụ thể nào sẽ thành công. –

Trả lời

3

Tôi khuyên bạn nên xem Kalman Filters hoặc mô hình không gian trạng thái chung hơn (SSM) được xác định bởi sách được đề xuất bên dưới là "giống như HMM, ngoại trừ trạng thái ẩn liên tục".

tôi có thể đề nghị một chương cuốn sách về chủ đề này - chương 18 trong Kevin P. Murphy của "Machine Learning: một cách tiếp cận xác suất"; Ngoài ra còn có các tài nguyên trực tuyến (tra cứu bộ lọc Kalman), nhưng tôi không thể đề nghị bất kỳ một cụ thể.

EDIT: bạn có thể tìm thấy tài liệu tham khảo here để sử dụng bộ lọc Kalman với R để dự đoán chuỗi thời gian.

Hope this helps,

+0

Cảm ơn bạn etov, tôi đã suy nghĩ về bộ lọc Kalman trước nhưng nó có vẻ như nó được sử dụng để dự đoán các bước tiếp theo trong một loạt, chứ không phải để dự đoán toàn bộ một loạt thứ hai. Bạn có thể chỉ cho tôi cách tôi sẽ sử dụng nó để dự đoán về chuỗi thời gian thứ hai không? – user2077851

+0

Ngoài ra, liệu họ có đang đưa ra giả định markov, rằng chỉ có trạng thái gần đây nhất ảnh hưởng đến các bang trong tương lai? – user2077851

+0

Trực giác là bạn có thể xử lý vị trí của tàu như một phép đo ồn ào về vị trí của tàu ngầm. tiếng ồn không nhất thiết phải là màu trắng - nó có thể có các hiệu ứng khác nhau, dựa trên các sự kiện trong quá khứ. Vì vậy, về cơ bản, dự đoán vị trí của tàu ngầm là tương tự để ước tính các thông số mô hình ẩn. Tôi không chắc nó là tổng quát như tất cả các trường hợp bạn đề cập đến, nhưng tôi nghĩ nó có thể bao gồm ít nhất một số trong số họ. – etov

Các vấn đề liên quan