Manzoor Ahmad Chachoo Dr.
O sistema de diálogo falado tem um parâmetro incerto durante o reconhecimento de voz que controla o seu desempenho que varia para os diferentes utilizadores, bem como para o mesmo utilizador durante múltiplas repetições mesmo do mesmo diálogo. Este artigo discute como os erros de reconhecimento nas declarações dos utilizadores podem ser tratados utilizando técnicas de aprendizagem semi-supervisionadas sobre o modelo de estado vetorial oculto (HVS). O modelo HVS é uma extensão do modelo básico de Markov em que o contexto é codificado em cada estado como um vetor. As transições de estado no HVS são tidas em conta numa operação de deslocamento de pilha semelhante ao autómato push-down. O modelo HVS, sendo um modelo estatístico, requer muitos dados de treino rotulados, o que é praticamente difícil. Neste artigo apresentamos como as abordagens de aprendizagem semi-supervisionada de classificação e maximização de expectativas podem ser treinadas em corpora rotulados e não rotulados para lidar com a incerteza do utilizador, bem como com os erros de reconhecimento pelo sistema de reconhecimento de fala. Os resultados experimentais mostram que a estrutura proposta utilizando o modelo HVS pode melhorar o desempenho da gestão do diálogo do sistema de diálogo falado quando comparado com o modelo de base.