Abstrato

Data Mining 2016: Construir redes de palavras baseadas em clusters a partir de dados textuais - Han-joon Kim -University of Seoul

Han-joon Kim e Han-mook Ryu

Este artigo descreve outro método de fornecer sistemas de palavras cada vez mais críticos a partir de informação literária, unindo procedimentos de agrupamento de texto e afiliação de frases de efeito. Fundamentalmente, um dos pontos de vista urgentes na mineração de texto é o exame das ligações de ideias, onde as ideias começam a partir de palavras de ordem. A questão é encontrar um arranjo cada vez mais sensato de frases de efeito e das suas ligações, denominado “rede de palavras”. De um modo geral, os sistemas de palavras podem ser trabalhados utilizando a recorrência de coevento de palavras registadas. Seja como for, apenas a recorrência do co-evento não é suficiente para avaliar a qualidade da relação entre palavras, à luz do facto de as relações dignas de nota com recorrência geralmente baixa serem negligenciadas. No nosso trabalho, para resolver o problema, planeamos utilizar a palavra tarefa de afiliação sobre os resultados agrupados para a abordagem de registos, em vez de um ficheiro inteiro. Em vez de construir um arranjo de palavras a partir de todo o arranjo de ficheiros, provavelmente separará relações de palavras cada vez mais importantes dos efeitos posteriores agrupados dos registos. A nossa técnica proposta é executada extensivamente em duas fases: Em primeiro lugar, uma determinada coleção de registos é dividida em vários grupos, cada um dos quais é chamado de árvore de cruzamento de bases, com origem na mineração de afiliação anterior. Aqui, notamos que cada grupo incorpora muitos registos com exemplos de eventos de palavras comparáveis ??e, portanto, teria palavras explícitas de grupo e as suas afiliações sólidas. Desta forma, como um estágio subsequente, a nossa técnica calcula iterativamente dados comuns ponderados que avaliam o nível de notabilidade entre dois hubs de palavras e concentra as N principais palavras grandes e as suas afiliações de declaração cobertas em cada cluster. lo. Apresentamos um cálculo para a abordagem de agrupamento de conteúdos individuais que capacita as empresas para armazenar automaticamente estes dados. Neste arranjo de duas secções, investigaremos o agrupamento de texto e como obter fragmentos de conhecimento a partir de informação não estruturada. Será uma qualidade incrível e moderna. O segmento inicial irá focar-se na inspiração. A parte subsequente será sobre a execução. Esta publicação é o segmento inicial do arranjo de duas secções sobre a melhor forma de obter informações a partir de informações não estruturadas utilizando o agrupamento de texto. Montaremos isto de forma comedida para que possa ser aplicado muito bem a qualquer conjunto de dados. Além disso, também nos iremos concentrar em descobrir as funcionalidades de uma API para que possa funcionar como um modelo adequado e funcional sem interrupções nas estruturas atuais. Clustering de texto: como obter conhecimentos rápidos de dados não estruturados - Parte 1: A motivação informação e, lamentavelmente,uma grande parte dele é de natureza não estruturada. Há uma abundância de informação sob a forma de texto de fluxo livre a viver nos nossos depósitos de informação. Embora existam inúmeras estratégias lógicas configuradas que ajudam a processar e examinar a informação organizada (por exemplo, numérica), existem menos estratégias focadas na decomposição da informação em linguagem regular. A solução: Para ultrapassar estes problemas, desenvolveremos uma abordagem de agrupamento de livros sem ajuda que permita às empresas receber automaticamente esta informação. Estes próprios receptáculos são produzidos automaticamente dependendo da compreensão da informação pelo cálculo. Isto ajudaria a mitigar o volume de informação e a compreender facilmente a gama mais extensa. Assim, em vez de tentar compreender um grande número de colunas, é um bom presságio compreender as principais frases de efeito em cerca de 50 grupos. reconhecer a obra-prima questões e podem tornar-se sujeitos de concentração alargada ou informatização. As auditorias de clientes sobre um item ou marca específica podem ser resumidas, o que realmente estabelecerá o guia para a associação As informações de avaliações podem ser facilmente divididas currículos e outras informações não estruturadas no mundo de RH podem ser facilmente examinadas. é um cálculo de IA não exclusivo que pode ajudar a inferir pedaços de conhecimento numa estrutura amigável a partir de enormes pedaços de conteúdo não estruturado.Este resumo é interminável, mas o objetivo do centro é um cálculo de IA não exclusivo que pode ajudar a inferir pedaços de conhecimento numa estrutura amigável a partir de enormes pedaços de conteúdo não estruturado.Este resumo é interminável, mas o objetivo do centro é um cálculo de IA não exclusivo que pode ajudar a inferir pedaços de conhecimento numa estrutura amigável a partir de enormes pedaços de conteúdo não estruturado.

Biografia:

Han-joon Kim recebeu os seus diplomas de licenciatura e mestrado em Ciência da Computação e Estatística pela Universidade Nacional de Seul, Seul, Coreia, em 1994 e 1996, respetivamente. Fez o seu doutoramento em Ciência e Engenharia da Computação pela Universidade Nacional de Seul, Seul, Coreia, em 2002. Atualmente é professor na Escola de Engenharia Elétrica e de Computação da Universidade de Seul, Coreia. Os seus atuais interesses de investigação incluem a mineração de dados/texto, sistemas de base de dados e recuperação inteligente de informação.

Isenção de responsabilidade: Este resumo foi traduzido usando ferramentas de inteligência artificial e ainda não foi revisado ou verificado

Indexado em

Google Scholar
Academic Journals Database
Open J Gate
Academic Keys
ResearchBible
CiteFactor
Electronic Journals Library
RefSeek
Hamdard University
Scholarsteer
International Innovative Journal Impact Factor (IIJIF)
International Institute of Organised Research (I2OR)
Cosmos

Veja mais