Tôi vừa đưa ra ý tưởng rằng tôi muốn phát triển thành một ứng dụng để phân biệt/tự động phát hiện tiếng nói từ những người khác nhau.Có nghiên cứu nào hiện có trong Nhận dạng giọng nói có thể phân biệt giọng nói với những người khác nhau không?
trường hợp sử dụngmẫu: Sau khi đào tạo với dữ liệu Obama và Romney, ứng dụng sẽ có thể phát hiện bất cứ khi nào một trong hai nói chuyện một lần nữa (không cần thiết cùng một nội dung từ dữ liệu huấn luyện)
tôi tự hỏi nếu có bất kỳ nghiên cứu hiện tại về điều này. (Tôi không biết cách tìm kiếm điều này. Tôi đã thử một vài từ khóa và không có kết quả đáng kể.)
Nếu không, cách tốt nhất để bắt đầu là gì? Cách chọn các đối tượng địa lý, dữ liệu, mô hình, v.v.
Cảm ơn!