2013-06-15 24 views
5

Tôi đang gặp một số vấn đề khi hiểu thuật toán Baum-Welch hoạt động chính xác như thế nào. Tôi đọc rằng nó điều chỉnh các thông số của HMM (khả năng chuyển đổi và phát xạ) để tối đa hóa xác suất mà chuỗi quan sát của tôi có thể được xem bởi mô hình đã cho.Tôi phải huấn luyện HMM với Baum-Welch và nhiều quan sát như thế nào?

Tuy nhiên, điều gì sẽ xảy ra nếu tôi có nhiều chuỗi quan sát? Tôi muốn đào tạo HMM của tôi chống lại rất nhiều quan sát (và tôi nghĩ rằng đây là những gì thường được thực hiện).

ghmm ví dụ có thể mất cả một chuỗi quan sát duy nhất và một bộ đầy đủ các quan sát đối với phương pháp baumWelch.

Tính năng này có hoạt động giống nhau trong cả hai trường hợp? Hay thuật toán phải biết tất cả các quan sát cùng một lúc?

Trả lời

5

Trong Rabiner của paper, các thông số của GMMs (trọng lượng, phương tiện và hiệp phương sai) đều được tái ước tính trong thuật toán Baum-Welch sử dụng các phương trình:

enter image description here

Đây chỉ cho chuỗi quan sát đơn trường hợp. Trong nhiều trường hợp, các tử số và mẫu số chỉ là được cộng lại trên tất cả các chuỗi quan sát, và sau đó được chia để lấy các tham số. (điều này có thể được thực hiện vì chúng chỉ đại diện cho số lượng nghề nghiệp, xem trang 273 của bài báo)

Vì vậy, không cần biết tất cả các chuỗi quan sát trong khi gọi thuật toán. Ví dụ, công cụ HERest trong HTK có một cơ chế cho phép chia nhỏ dữ liệu đào tạo giữa nhiều máy. Mỗi máy tính toán tử số và mẫu số và đổ chúng vào một tập tin. Cuối cùng, một máy đơn đọc các tệp này, tổng hợp các tử số và mẫu số và chia chúng để có kết quả. Xem pg. 129 của cuốn sách HTK v3.4

Các vấn đề liên quan