tôi nhận được một giải pháp đó là làm việc tốt để có bài phát biểu công nhận và ghi âm . Đây là link cho một dự án Android đơn giản mà tôi đã tạo để hiển thị giải pháp đang hoạt động. Ngoài ra, tôi đặt một số màn hình in bên trong dự án để minh họa cho ứng dụng.
Tôi sẽ cố giải thích ngắn gọn cách tiếp cận tôi đã sử dụng. Tôi kết hợp hai tính năng trong dự án đó: Google Speech API và Flac recording.
API Google Speech được gọi thông qua kết nối HTTP. Mike Pultz cung cấp thêm thông tin chi tiết về API:
"(...) API [Google] mới là API truyền trực tiếp song công. Điều này có nghĩa là nó thực sự sử dụng hai kết nối HTTP - một yêu cầu POST để tải lên nội dung dưới dạng luồng chunked "sống" và yêu cầu GET thứ hai để truy cập vào các kết quả, điều này có ý nghĩa hơn đối với các mẫu âm thanh dài hơn hoặc để phát trực tuyến âm thanh ".
Tuy nhiên, API này cần nhận tệp âm thanh FLAC để hoạt động bình thường. Điều đó khiến chúng tôi chuyển sang phần thứ hai: Ghi âm Flac
Tôi đã thực hiện ghi Flac trong dự án đó thông qua trích xuất và điều chỉnh một số đoạn mã và thư viện từ một ứng dụng mã nguồn mở được gọi là AudioBoo. AudioBoo sử dụng mã gốc để ghi lại và chơi định dạng flac.
Do đó, bạn có thể ghi lại âm thanh flac, gửi âm thanh tới API Google Speech, tải văn bản và phát âm thanh vừa được ghi.
Dự án tôi đã tạo có nguyên tắc cơ bản để làm cho nó hoạt động và có thể được cải thiện cho các tình huống cụ thể. Để làm cho nó hoạt động trong một kịch bản khác, bạn cần có khóa Google Speech API, được lấy từ một phần của nhóm Google Chromium-dev. Tôi để lại một chìa khóa trong dự án đó chỉ để cho thấy nó hoạt động, nhưng cuối cùng tôi sẽ loại bỏ nó. Nếu ai đó cần thêm thông tin về nó, hãy cho tôi biết nguyên nhân tôi không thể đặt nhiều hơn 2 liên kết trong bài đăng này.
Bạn có biết liệu điều này có được bao gồm trong API không? Nếu bạn không tìm thấy cách giải quyết cho việc gửi bản ghi của riêng bạn đến Google? – ahsteele
Tôi tự hỏi điều tương tự. Tôi không thể tin rằng Android là mức cao này, nghiêm túc là thiếu API khi nói đến phương tiện truyền thông. – Tom
Android không được cung cấp Bất kỳ thư viện nào để thực hiện việc này. – sravan