Tôi đang cố gắng tìm cách thu âm giọng nói tổng hợp và ghi lại nó thành một tệp âm thanh. Tôi hiện đang sử dụng pyttsx làm thư viện chuyển văn bản thành giọng nói của mình, nhưng không có cơ chế để lưu đầu ra vào tệp, chỉ phát trực tiếp từ loa. Tôi đã xem xét detecting and recording audio cũng như PyAudio, nhưng chúng dường như có đầu vào từ micrô thay vì chuyển hướng âm thanh đi tới một tệp. Có cách nào để biết điều này không?Ghi tổng hợp văn bản thành giọng nói thành một tệp bằng Python
7
A
Trả lời
4
Bạn có thể gọi espeak với đối số -w bằng cách sử dụng subprocess.
import subprocess
def textToWav(text,file_name):
subprocess.call(["espeak", "-w"+file_name+".wav", text])
textToWav('hello world','hello')
Điều này sẽ viết file_name.wav mà không đọc to. Nếu văn bản của bạn nằm trong tệp (ví dụ: text.txt), bạn cần gọi espeak với thông số -f ("-f" + văn bản). Tôi khuyên bạn nên đọc espeak man pages để xem tất cả các tùy chọn bạn có.
Hy vọng điều này sẽ hữu ích.
1
Bạn có thể sử dụng trình bao bọc SAPI nâng cao hơn để lưu đầu ra vào tệp wav. Ví dụ, bạn có thể thử
https://github.com/DeepHorizons/tts
Mã nên trông như thế này:
import tts.sapi
voice = tts.sapi.Sapi()
voice.set_voice("Joey")
voice.create_recording('hello.wav', "Hello")
2
Dưới đây là một ví dụ trong đó cung cấp cho bạn truy cập vào các API NSSpeechSynthesizer
#!/usr/bin/env python
from AppKit import NSSpeechSynthesizer
import sys
import Foundation
if len(sys.argv) < 2:
text = raw_input('type text to speak> ')
else:
text = sys.argv[1]
nssp = NSSpeechSynthesizer
ve = nssp.alloc().init()
ve.setRate_(100)
url = Foundation.NSURL.fileURLWithPath_('yourpath/test.aiff')
ve.startSpeakingString_toURL_(text,url)
Các vấn đề liên quan
- 1. Giọng nói của công cụ chuyển văn bản thành giọng nói của Google?
- 2. Chuyển đổi giọng nói thành văn bản trong iphone
- 3. Tổng hợp giọng nói của bài phát biểu bằng lời nói trên web - nhận danh sách bằng giọng nói
- 4. Làm thế nào để lưu chuyển văn bản thành giọng nói thành wav với Microsoft SAPI?
- 5. Google dịch chuyển văn bản thành giọng nói bằng tiếng Anh
- 6. Làm thế nào để sử dụng bộ tổng hợp giọng nói của iOS theo chương trình? (văn bản thành lời nói)
- 7. Có cách nào để gửi tệp âm thanh đến nhận dạng giọng nói thành văn bản
- 8. Văn bản thành lời nói (TTS) -Android
- 9. Cách đặt âm lượng cho phương thức "nói" từ văn bản thành giọng nói?
- 10. Lấy danh sách các giọng nói chuyển văn bản thành giọng nói của Mac theo chương trình?
- 11. Làm cách nào để chuyển đổi giọng nói thành văn bản?
- 12. Ghi âm giọng nói bằng Java
- 13. Bản ghi âm thanh thời gian miễn phí (lời nói thành văn bản)?
- 14. Cách tạo công cụ chuyển văn bản thành giọng nói tùy chỉnh
- 15. lời nói thành văn bản trong android
- 16. Làm cách nào để lưu tệp Văn bản thành giọng nói dưới định dạng .wav/.mp3 trong Bộ nhớ ngoài
- 17. Các công cụ chuyển văn bản thành giọng nói (TTS) mã nguồn mở chất lượng cao được viết bằng C++
- 18. Làm cách nào để kích hoạt lời nói thành văn bản bằng một nút?
- 19. Một số tài nguyên tốt để thực hiện chuyển văn bản thành giọng nói trong .NET là gì?
- 20. Đọc tệp văn bản thành một mảng
- 21. Làm thế nào để mã hóa giọng nói đã ghi thành ogg vorbis?
- 22. C# Nhận dạng giọng nói
- 23. Python ghi chuỗi byte thành tệp
- 24. Lọc tệp văn bản thành tệp văn bản mới
- 25. Chèn bản ghi bằng Khóa tổng hợp bằng NHibernate
- 26. Đăng nhập Hủy đầu ra thành một tệp văn bản
- 27. Nhập bằng giọng nói/giọng nói trực tiếp trên trình duyệt di động
- 28. Trình tạo nghệ thuật văn bản thành ASCII bằng Python
- 29. Làm cách nào để lưu tệp Văn bản thành giọng nói dưới định dạng .wav/.mp3 bằng tiếng Ả Rập trong Bộ nhớ ngoài?
- 30. Nối văn bản vào tệp bằng Python
Awesome, mà đã làm lừa! Cảm ơn! – petrichor