Doutor V. Radha e G.Anuradha
Na era moderna da comunicação, o áudio desempenha um papel importante na compreensão dos meios digitais. Devido ao aparecimento de dispositivos de captura de áudio económicos, a quantidade de dados de áudio disponíveis tanto online como offline é enorme e as técnicas que possam classificar e recuperar automaticamente estes dados de áudio são uma necessidade imediata. Um sistema automático de classificação e recuperação de áudio baseado em conteúdo consiste em três módulos, nomeadamente extração, classificação e recuperação de características. Este artigo apresenta um estudo comparativo de dois algoritmos que executam estes três passos de formas diferentes. O desempenho dos sistemas selecionados é analisado utilizando quatro características diferentes (coeficientes acústicos, percetivos, coeficientes cepstrais de frequência mel (MFCC) e uma combinação de percetivo e MFCC) e quatro classificadores que melhoram a Máquina de Vetores de Suporte (SVM) e a Rede Neural Centróide ( CNN) juntamente com as suas versões base, SVM e CNN. Os resultados experimentais mostraram que o algoritmo SVM melhorado ao utilizar o vetor de características combinado produziu uma maior precisão e uma taxa de erro reduzida.