K.Vanitha e R.Santhi
Neste artigo descrevemos uma implementação de Apriori baseado em Hash. Analisámos, teórica e experimentalmente, a principal estrutura de dados da nossa solução. Esta estrutura de dados é o principal fator para a eficiência da nossa implementação. Propomos um algoritmo eficaz baseado em hash para a geração de conjuntos de candidatos. Explicitamente, o número de conjuntos de 2 itens candidatos gerados pelo algoritmo proposto é, em ordens de grandeza, inferior ao dos métodos anteriores, resolvendo assim o estrangulamento de desempenho. A nossa abordagem verifica a base de dados uma vez, utilizando uma versão melhorada do algoritmo a priori Note-se que a geração de conjuntos de candidatos mais pequenos permite-nos reduzir eficazmente o tamanho da base de dados de transações numa fase muito anterior das iterações, reduzindo significativamente o custo computacional para iterações posteriores.