Tôi có thể tìm tài liệu về định dạng mô hình ngôn ngữ ARPA ở đâu?Tài liệu mô hình ngôn ngữ ARPA
Tôi đang phát triển ứng dụng nhận dạng giọng nói đơn giản với động cơ STT bỏ túi. ARPA được khuyến nghị ở đó vì lý do hiệu suất. Tôi muốn hiểu tôi có thể làm gì để điều chỉnh mô hình ngôn ngữ cho các nhu cầu tùy chỉnh của mình.
Tất cả tôi thấy là một số rất ngắn gọn ARPA định dạng giới thiệu:
- http://kered.org/blog/2008-08-12/arpa-language-model-file-format/
- http://www.speech.sri.com/projects/srilm/manpages/ngram-format.5.html
- http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html
tôi mới bắt đầu để STT và tôi gặp khó khăn để quấn quanh đầu xung quanh này (n-gram, v.v ...). Tôi đang tìm tài liệu chi tiết hơn. Một cái gì đó như tài liệu về ngữ pháp JSGF đây:
hãy xem liên kết msdn này .. định dạng arpa và args được giải thích rõ ràng [Định dạng tệp đầu vào và đầu ra biên dịch ngữ pháp] (https://msdn.microsoft.com/en-us/library/office/hh378460 (v = office.14) .aspx) –