Muthukumar. RC Chandrasekar
Indexar uma base de dados XML no data warehouse é um problema complexo. A principal justificação para indexar a base de dados XML no data warehouse deve-se ao ambiente heterogéneo e estrutural dos dados XML que pode construir padrões de consulta fastidiosos. Técnicas existentes focadas em métodos de clustering baseados na integração do data warehouse com dados web para técnicas de Processamento Analítico Online (OLAP). Através do processo de agrupamento, a recuperação rápida de informação é impossível porque a técnica de agrupamento é utilizada exatamente para a estrutura de construção de padrões de árvore. A maioria das estratégias de indexação XML divide-o em várias subconsultas e, posteriormente, liga os seus resultados para apresentar a resposta à consulta exclusiva. As operações de junção foram determinadas como o componente mais demorado no processamento de consultas XML para recuperação de informação. Para melhorar os critérios de pesquisa na base de dados XML presente no data warehouse, neste artigo é utilizado um esquema de indexação que separa os dados com base no objetivo. É apresentada uma técnica de indexação XSeq com base no framework de padrões de estrutura em árvore. O XSeq constrói a sua estrutura de infraestrutura de indexação de uma forma muito mais simples e simboliza os dados XML e as consultas XML como sequências codificadas de formação. Além disso, a infraestrutura XSeq une o conteúdo e a construção de documentos XML, conseguindo assim uma apresentação adicional sobre a indexação apenas do conteúdo e da construção, ou indexando-os individualmente. Uma melhoria fiável de desempenho é conseguida com o IRIS (Recuperação de Informação usando Esquema de Indexação) proposto em base de dados XML para data warehouse, em comparação com uma técnica SDC existente para OLAP, em termos de comprimento do caminho de pesquisa, custo de investigação e manutenção.