Pushpalata Pujari
Este artigo descreve a análise de desempenho de diferentes classificadores de data mining antes e depois da seleção de características num conjunto de dados binomiais. Três classificadores de data mining: classificadores de regressão logística, SVM e rede neural são considerados neste artigo para classificação. O conjunto de dados dos registos de votação do Congresso é um conjunto de dados binomial investigado neste estudo retirado do repositório de aprendizagem automática da UCI. O desempenho de classificação de todos os classificadores é apresentado utilizando medidas estatísticas de desempenho como a precisão, especificidade e sensibilidade. O gráfico de ganho e o gráfico ROC (Receiver Operating Characteristics) também são utilizados para medir o desempenho dos classificadores. É realizado um estudo comparativo entre os classificadores de data mining. O resultado experimental mostrou que, sem seleção de características, a regressão logística e os classificadores SVM fornecem 100% de precisão e a rede neural fornece 98,13% de precisão no conjunto de dados de teste. Com a seleção de características, o classificador SVM fornece 100% de precisão. O desempenho do classificador SVM é considerado o melhor entre todos os classificadores com um número reduzido de características.