2016-09-26 23 views
5

Tôi đã sử dụng API Google Speech của Google và đã chuyển sang sử dụng API Google Cloud Speech gần đây. Kể từ khi API thoại trên đám mây của Google được công bố, hiệu suất dường như đã bị suy giảm về tính chính xác của sự công nhận. Ngoài ra tôi thấy rằng ngày càng có nhiều "kết quả trống" trở lại để phát trực tuyến âm thanh.google cloud speech api trả về kết quả trống

Tôi đồng thời phát âm thanh đồng thời sang nhiều dịch vụ khác nhau và API Google Cloud Speech trả về kết quả trống trong khi một số dịch vụ khác đang trả về văn bản được sao chép. Làm tôi băn khoăn liệu có bất kỳ điều gì đã thay đổi trong cách API giọng nói Chromium và API Google Cloud Speech hoạt động không?

Tôi đã xác thực âm thanh cho các tiêu đề phù hợp và xác thực rằng tôi đang phát âm thanh tới Google.

Có ai gặp Google đôi khi (giống như phần lớn thời gian) trả về kết quả trống không?

+0

liên quan đến http://stackoverflow.com/questions/38906527/google-speech-recognition-api-result-is-empty –

Trả lời

4

Loại câu hỏi này phù hợp hơn với Bộ theo dõi sự cố công cộng vì nó sẽ yêu cầu thêm chi tiết để tái tạo các lỗi chính xác của bạn. Đảm bảo điền vào số form này với thông tin bắt buộc hoặc ít nhất với ví dụ làm việc tối thiểu về mã của bạn làm nổi bật rõ ràng vấn đề. Để tái tạo chính xác, điều quan trọng là cung cấp mã mẫu hoặc lệnh mà bạn đã thực thi và trả về lỗi cùng với tệp cấu hình và URI (hoặc tệp) của tệp âm thanh bạn đã phát trực tuyến và trả lại kết quả trống.

Thực tế, đã tồn tại các sự cố đã biết với API giọng nói hiện đang trong giai đoạn Beta và do đó có thể ngăn việc phiên âm hoạt động chính xác. Trong thời gian chờ đợi, bạn có thể tham khảo documentation sau đây để xác định xem có bất kỳ phương pháp hay nhất nào áp dụng cho trường hợp của bạn hay không.

1

Tôi cũng nhận được phản hồi trống nhưng cuối cùng nhận được kết quả bằng cách mã hóa với các cài đặt khác nhau.

sox async.wav -t raw --channels=1 --bits=16 --rate=16000 --encoding=signed-integer --endian=little async.raw

1

Tôi cũng có cùng một vấn đề mà Google Speech API trở lại kết quả trống. Tôi đã sử dụng FFmpgeg để chuyển đổi tệp âm thanh của mình thành LINEAR16. Để cài đặt công cụ này tôi đã sử dụng Homebrew:

brew install ffmpeg 

Để chuyển đổi tập tin âm thanh của tôi để LINEAR16 tôi đã sử dụng lệnh này:

ffmpeg -i input.flac -f s16le -acodec pcm_s16le output.raw 

Và sau khi tôi nạp nó để stogage Google của tôi: https://console.cloud.google.com/storage/browser/

đây là tệp JSON của tôi có cấu hình để thực hiện yêu cầu:

{ 
    'config': { 
     'encoding':'LINEAR16', 
     'sampleRate': 16000, 
     'languageCode': 'en-US' 
    }, 
    'audio': { 
     'uri':'gs://your-bucket-name/output.raw' 
    } 
} 

Cho f iles hơn 1 phút, bạn cần phải sử dụng phương pháp Asyncrecognize:

curl -s -k -H "Content-Type: application/json" \ 
-H "Authorization: Bearer [YOUR-KEY]" \ 
https://speech.googleapis.com/v1beta1/speech:asyncrecognize \ 
-d @sync-request.json 

nó sẽ trả về id hoạt động. Bạn có thể kiểm tra xem nó đã sẵn sàng chưa bằng cách lấy kết quả hoạt động:

curl -s -k -H "Content-Type: application/json" \ 
-H "Authorization: Bearer " [YOUR-KEY]\ 
https://speech.googleapis.com/v1beta1/operations/[OPERATION-ID] 
Các vấn đề liên quan