Nikhil D. Karande, Rohit V. Kumbhar, Abhijeet L. Jadhav, Sharad G. Bhosale, Swapnil S. Patil
A fala transmite vários níveis de informação. A um nível primário, a fala transmite as palavras ou a mensagem falada, mas a um nível secundário, a fala também revela informação sobre quem fala. Neste artigo apresentamos uma visão geral dos nossos esforços de investigação numa área de reconhecimento automático de locutor. Baseamos a nossa abordagem numa técnica estatística de modelação de altifalantes que representa os sons característicos subjacentes da voz de uma pessoa. Usando estes modelos, construímos reconhecedores de locutores que são computacionalmente baratos e capazes de reconhecer um locutor independentemente do que está a ser dito. O desempenho dos sistemas é avaliado para uma vasta gama de qualidade de fala; da fala limpa à fala telefónica, utilizando vários corpora de fala padrão.