J. Ashok Kumar e PR Rao
Na aprendizagem supervisionada, os classificadores são treinados com dados que consistem em etiquetas de classes para resolver problemas de classificação do mundo real. Árvores de decisão, floresta aleatória, Bayes ingénuos, redes Bayesianas, regressão logística K-vizinhança mais próxima, redes neuronais artificiais e máquinas de vetores de suporte são algumas das técnicas de classificação mais populares entre a classe de classificadores populares disponíveis para os investigadores. Embora cada uma destas técnicas tenha os seus próprios pontos fortes para lidar com diversos problemas do mundo real, também apresentam problemas inerentes. Nenhuma técnica de classificação pode ser aplicada universalmente para todas as aplicações do mundo real. No passado, vários investigadores tentaram compreender o comportamento destas técnicas aplicando-as a diferentes áreas de investigação. No presente artigo, experimentámos conjuntos de dados de treino e teste utilizados por alguns dos investigadores para obter uma melhor compreensão do comportamento dos classificadores acima referidos. Estudo revela a inadequação de algumas das técnicas e a superioridade das máquinas de vetores de suporte e da regressão logística sobre outras ferramentas utilizadas.