2009-01-18 30 views
5

Tôi dự định bắt đầu một ứng dụng chuyển đổi lời nói thành văn bản trong Linux. Có bất kỳ giao diện hiện có nào để tôi có thể mở rộng chúng không? hoặc Có bất kỳ ứng dụng hiện có nào như vậy trong Linux không? Bất kỳ đầu vào nào về điều này?Lời nói để chuyển đổi văn bản trong Linux

EDIT: Ứng dụng mà tôi đang lập kế hoạch viết sẽ có thể chuyển đổi mọi từ mà chúng tôi nói thành văn bản, không chỉ là Có/Không.

Trả lời

8

Vâng, điều này là khá một cam kết và không nói những gì công nghệ bạn muốn sử dụng, sau đây là một số liên kết:

Chúc may mắn. Với chi tiết hơn, chúng tôi có thể cung cấp câu trả lời tốt hơn. Ví dụ, có một sự khác biệt lớn giữa "yes/no" nhận dạng kiểu trung tâm cuộc gọi so với sự hiểu biết ngôn ngữ tự nhiên một phần.

3

Đề xuất của Dave là một khởi đầu tuyệt vời. Nhân sư rất tiện lợi.

Tôi chỉ muốn thêm rằng bạn nên càng xác suất càng tốt. Là một nhà ngôn ngữ học một lần và thậm chí trước đó là một lần phát âm vị ngữ âm, tôi có thể tự tin nói rằng đừng bắt kịp với các mô hình ngôn ngữ. Chúng ta không thể quên được những thứ không được phân bổ "mỗi khi tôi kích hoạt một nhà ngôn ngữ học, độ chính xác của tôi tăng lên". Nó thực sự là về mô hình và khả năng của nó để giải thích cho tiếng ồn và sự thay đổi hơn là bất cứ thứ gì về nghệ thuật tự do chủ yếu từ MIT phải nói.

Một cuốn sách hay để chọn sẽ là "Xử lý lời nói và ngôn ngữ" của Jurafsky và Martin. Nó có một số ứng dụng rất hữu ích của các mô hình tính toán cho nhiệm vụ. Công trình của Harvey Sussman về mối tương quan tuyến tính ở các sườn F2 cho một loạt các nguyên âm (bắt đầu với những con chuồng và làm việc theo hướng con người) có vẻ như sẽ là một điều tốt đẹp để thực hiện trong mô hình một trong những ngày này.

1

Nhân sư là đặt cược tốt nhất của bạn trên linux. Tôi đã thử Sphinx II và Sphinx III. Có một số ngôn ngữ nguồn mở và các mô hình âm thanh có sẵn có thể được sử dụng với mỗi một trong số chúng. Không phải là một mức sản xuất ở tất cả, nhưng đủ tốt để tạo mẫu hoặc demo. Để sản xuất, bạn sẽ cần phát triển ngôn ngữ và mô hình âm thanh của riêng bạn.

Các vấn đề liên quan