Veenita Gupta, Neeraj Kumar, Praveen Kumar
A mineração de conjuntos de itens frequentes é uma tarefa fundamental na mineração de dados. Infelizmente, o número de conjuntos de itens frequentes que descrevem os dados é muitas vezes demasiado grande para ser compreendido. Este problema foi atacado por representações condensadas de conjuntos de itens frequentes que são subcoleções de conjuntos de itens frequentes contendo apenas os conjuntos de itens frequentes que não podem ser deduzidos de outros conjuntos de itens frequentes na subcoleção, utilizando algumas regras de dedução. As abordagens de mineração de conjuntos de itens frequentes mais conhecidas enumeram conjuntos de itens candidatos, determinam o seu suporte e eliminam os candidatos que não conseguem atingir o suporte mínimo especificado pelo utilizador. Para além deste esquema, podemos utilizar a abordagem de interseção para identificar o conjunto de itens frequentes. Os conjuntos fechados de itens frequentes podem ser representados como a intersecção de algum subconjunto de determinadas transações. À medida que a base de dados transacional aumenta, o tamanho da árvore de prefixos também aumenta, o que torna difícil o seu manuseamento. Foram feitas experiências para descobrir a utilização eficiente da memória da árvore de prefixos. Foi sugerida uma melhoria para reduzir o número total de ramificações na árvore de prefixos, levando à redução do seu tamanho.