Kanhaiya Lal e NC Mahanti
Os algoritmos de mineração de regras de associação concentram-se na descoberta de regras válidas testando todos os itens ou elementos do domínio, em vez de testar alguns elementos conhecidos, o que torna o processo ineficiente, uma vez que gera um número muito grande de candidatos . Além disso, a maioria dos algoritmos realiza múltiplas passagens pela base de dados e isso resulta num custo de E/S muito elevado. Uma vez que uma base de dados reside no disco e não pode ser gerida completamente na memória principal, várias passagens pela base de dados prejudicam consideravelmente o desempenho de qualquer algoritmo de mineração de regras de associação conhecida. A proposta de solução para este problema é separar subdomínios disjuntos, que são correlacionados. Neste artigo focamo-nos em 1. A separação de subdomínios que são compostos por elementos correlacionados no domínio. 2.º Resumo da base de dados. Os itens de um domínio grande correlacionam-se entre si formando pequenos subgrupos, ou seja, o domínio é agrupado em pequenos grupos [3]. Esta propriedade aparece em muitos casos do mundo real, por exemplo, Bioinformática, comércio eletrónico, etc. ao tamanho exponencial dos candidatos de Apriori na forma pura. A maioria dos algoritmos realiza múltiplas passagens por toda a base de dados, o que resulta em ineficiência e elevadas sobrecargas de E/S. O algoritmo proposto mantém uma lista de transações relacionadas com o componente em processamento e, por isso, apenas essas transações são processadas em vez de toda a base de dados.