Tôi muốn xây dựng một mô hình ngôn ngữ cho Nhân sư CMU, nhưng kho văn bản của tôi có hơn 1000 từ nên tôi không thể sử dụng công cụ trực tuyến. Làm thế nào để sử dụng (các script trong cmuclmtk?) Để xây dựng mô hình ngôn ngữ của tôi?Làm cách nào để xây dựng mô hình ngôn ngữ từ vựng lớn cho Nhân sư CMU?
Trả lời
Vui lòng đọc các hướng dẫn
Không phải là một công việc tầm thường. Tạo ra một mô hình ngôn ngữ là một nhiệm vụ tốn thời gian và tài nguyên.
Nếu bạn muốn có một mô hình ngôn ngữ "tốt", bạn sẽ cần một văn bản lớn hoặc rất lớn để đào tạo một mô hình ngôn ngữ (suy nghĩ theo thứ tự độ dài vài năm của các bản tin trên báo phố).
"tốt" có nghĩa là: nếu mô hình ngôn ngữ sẽ có thể khái quát hóa từ dữ liệu huấn luyện để nhập dữ liệu mới và trước đây chưa từng
Bạn nên xem xét các tài liệu của Sphinx và bộ công cụ mô hình ngôn ngữ HTK.
http://cmusphinx.sourceforge.net/wiki/tutoriallm
Ngoài ra kiểm tra hai chủ đề sau đây:
Building openears compatible language model
Bạn có thể mất một ngôn ngữ mô hình tổng quát hơn, dựa trên một corpus lớn hơn và suy Ngôn ngữ mô hình nhỏ của bạn với nó .. ví dụ như một mô hình ngôn ngữ ngược lại ... nhưng đó không phải là một nhiệm vụ tầm thường.
- 1. Nhân sư: Danh sách các ngôn ngữ được hỗ trợ để làm nổi bật?
- 2. Nhân sư - Tài liệu mô hình Django
- 3. Xây dựng một mô hình ngôn ngữ tự nhiên, có thể chữa lỗi chính tả
- 4. Làm cách nào để triển khai ngôn ngữ có cùng ngôn ngữ nhanh hơn ngôn ngữ?
- 5. Làm thế nào để giữ đầu ra asm từ xây dựng mô-đun hạt nhân Linux
- 6. cách định cấu hình tác nhân xây dựng tfs để xây dựng hồ sơ xuất bản?
- 7. Nhân sư cho tài liệu mã php
- 8. Đặt Ngoại lệ cho Ngôn ngữ Trình gỡ lỗi (bỏ qua) trong Cấu hình Xây dựng
- 9. Làm cách nào để tìm hiểu ngôn ngữ từ một nhân vật?
- 10. có Mô hình phổ quát cho ngôn ngữ không?
- 11. Ngôn ngữ Agnostic Xây dựng hệ thống quản lý
- 12. Tài liệu mô hình ngôn ngữ ARPA
- 13. Làm cách nào để bạn xây dựng biến vị ngữ cho NSFetchRequest setHavingPredicate :?
- 14. 'Ngôn ngữ xây dựng' có nghĩa là gì?
- 15. Nhân sư thêm liên kết vào hình ảnh hoặc hình
- 16. Tìm kiếm bằng tiếng Ba Lan cho Nhân sư?
- 17. Cú pháp Erlang - Xây dựng một plugin hỗ trợ ngôn ngữ Intellij IDEA cho Erlang
- 18. Sử dụng ngữ pháp JSGF thay vì mô hình ngôn ngữ DMP (sử dụng -jsgf thay vì -lm) trong CMU Sphinx (pocketsphinx)
- 19. Làm cách nào để xây dựng mô hình 3D của một phòng từ 2 máy ảnh stereo? Yếu tố quyết định để xây dựng chính xác là gì?
- 20. Mã để xây dựng mô hình xem ở đâu?
- 21. Đa ngôn ngữ Ngôn ngữ
- 22. Ngôn ngữ nào lý tưởng cho robot
- 23. Làm cách nào để xuất một giá trị cấu hình trong tệp .rst Nhân sư?
- 24. Mô hình tốt để xây dựng trình hướng dẫn?
- 25. Hệ thống xây dựng văn bản tuyệt vời 2 cho ngôn ngữ lập trình C
- 26. Làm cách nào để sử dụng từ vựng với SpeechSynthesizer?
- 27. Làm thế nào để chuyển một giá trị để xây dựng mô-đun hạt nhân Linux vào lúc khởi động?
- 28. Làm cách nào để định dạng ngày hiện tại cho ngôn ngữ của người dùng?
- 29. Lớp nào sẽ xây dựng Mô hình xem?
- 30. Hình thức xây dựng cho Outlook 2007
Tài liệu đó rất hữu ích ngoại trừ 'Tạo từ điển'. Bản phân phối có đi kèm với tập lệnh để tạo từ điển đó không? – joeforker
Bạn có thể sử dụng công cụ phát âm mà bạn có thể kiểm tra từ subversion http://cmusphinx.svn.sourceforge.net/viewvc/cmusphinx/trunk/logios/Tools/MakeDict/ Có các gói g2p bên ngoài như http://code.google. com/p/phonetisaurus/hoặc sequitur-g2p, chúng cũng có thể được sử dụng. –
Nó xuất hiện pocketsphinx có một từ điển trong thư mục en_US, ngay bên cạnh các mô hình. Tôi sẽ thử sử dụng cái đó. – joeforker