2011-12-31 27 views
10

Tôi đang cố gắng tìm ra cách sử dụng sphinx4 hoặc pocketsphinx với mô hình voxforge tiếng Anh nhưng tôi không thể làm cho nó hoạt động. Tôi đã cố đọc các trang tài liệu (như trang này là http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html) nhưng nó không giúp tôi.Cách sử dụng CMU Sphinx 4 để nói thành văn bản với các mô hình voxforge tiếng Anh

Điều tôi muốn là tệp thực thi nơi tôi có thể chỉ định mô hình nào sẽ sử dụng và tệp âm thanh nào để sử dụng làm nguồn và có bản in thực thi, đó là phỏng đoán tốt nhất về giọng nói trên bản ghi.

tôi HADE một số may mắn với: recording.wav -infile pocketsphinx_continuous 2>/dev/null

Nhưng nó hủy bỏ trước khi các tập tin âm thanh hoàn toàn được sao chép và mô hình mặc định có waay để vài từ để tạo ra một thể đọc được văn bản từ âm thanh.

Tôi đã biên soạn và thử nghiệm các bản trình diễn trong gói nguồn sphinx4 nhưng tất cả các ví dụ dường như có vài từ và cần một mô hình loke voxforge một hữu ích cho tôi.

Tôi làm cách nào để thiết lập điều này?

+1

tôi đã có thể sửa đổi Sphinx để phiên âm bằng cách sử dụng các mô hình Voxforge. Tin xấu là ngay cả với Voxforge, độ chính xác của Sphinx cũng xấu hổ. Tôi sẽ không lãng phí thời gian của bạn với Sphinx. Nó không có giá trị gì cả. – Cerin

+0

@Cerin bạn sẽ đề xuất phương án thay thế nào? –

+0

Tôi cũng quan tâm đến các lựa chọn thay thế. Bạn có thể cho chúng tôi điều gì tốt hơn không? Ưu đãi miễn phí? – Simon

Trả lời

10

Rất đơn giản để cắm vào mô hình âm thanh Voxforge. Các tài liệu chính bao gồm các API là cmusphinx hướng dẫn:

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

Bạn nên đọc nó trước khi bạn bắt đầu. Cũng xin lưu ý rằng bạn nên sử dụng mô hình âm thanh En_US English Generic, nó chính xác hơn Voxforge.

Từng bước bạn cần phải làm như sau:

  • Tải voxforge model từ SourceForge và giải nén nó vào một thư mục
  • Thanh toán sphinx4 từ github và xây dựng nó với gradle
  • Run TranscriberDemo
  • Truy cập thư mục sphinx4-samples/src/main/java/edu/cmu/sphinx/demo/transcriber, mở Transcriber bản trình diễn và chỉnh sửa đường dẫn mô hình âm thanh như sau.
  • Chỉnh sửa vị trí của tập tin âm thanh trong các nguồn nếu bạn cần một tập tin âm thanh
  • Run bản demo lại và tận hưởng

Đó sẽ là nó

// Load model from the folder in your project 
    configuration.setAcousticModelPath("file:voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000"); 
+1

câu trả lời rất tốt đẹp ... tôi cũng có vấn đề tương tự tôi đã tải voxforge-en-0,3 từ SourceForge, thư mục etc có rất nhiều lọ, tôi chỉ không thể tìm ra đường dẫn nào sẽ được đưa ra ... vui lòng trợ giúp và truy cập http: // stackoverflow.com/questions/8727389/dictation-application-using-sphinx4 – aProgrammer

+0

Tôi không chắc bạn đang nói về điều gì. Những cái lọ nào trong v.v ...? Không có bình nào cả. Đối với câu hỏi đó, bạn đã không chỉ ra rõ ràng vấn đề cần giải quyết, không có vấn đề gì bạn có vấn đề ở đó. –

+0

Tôi theo câu trả lời của bạn và tải về VoxForge từ sourceforge, Tuy nhiên tôi không thể cấu hình nó để được sử dụng với Sphinx4. Bạn đã nói '', tuy nhiên nó không hoạt động đối với tôi. Vì vậy, tôi duyệt thư mục VoxForge, nhưng đã cố gắng kết hợp khác nhau ... nhưng không có gì đang làm việc cho đến nay ... plz Trợ giúp !! vui lòng xem câu trả lời đã chỉnh sửa .... – aProgrammer

Các vấn đề liên quan