Improving Word Similarity Using PPMIC
with Estimates of Word Polysemy

Nagajothi P; Hemalatha L; Kumari K; Jeevarathinam S

Abstrato

Improving Word Similarity Using PPMIC with Estimates of Word Polysemy

Nagajothi P, Hemalatha L, Kumari K, Jeevarathinam S

Measuring the semantic similarity between words is an important component in various tasks on the web such as relation extraction, community mining, document clustering, and automatic metadata extraction. But accurately measuring semantic similarity between two words or entities remains a challenging task. Point wise mutual information (PMI) is a widely used word similarity measure and it generates single sense for given word, but it lacks a clear explanation of how it works. PMI differs from distributional similarity, a novel metric is introduced PMImax, that augments PMI with information about a word’s number of senses. PMImax estimates the maximum correlation between two words, i.e., the correlation between their closest senses. The existence system found out the PMImax and also produced an empirical method to estimate semantic similarity using page counts and text snippets retrieved from a web search engine for two words. PMImax can only find synonymous concepts and “siblings” concepts (e.g., “train” and “truck”) but miss the “cousin” concepts. So the proposed system PPMIC (Positive Pointwise Mutual Information Cousins) concept can implement the cousin concept and also generates the top 50 most similar words for the noun. PPMIC has an amazing ability to improve the word similarity with word polysemy.

Isenção de responsabilidade: Este resumo foi traduzido usando ferramentas de inteligência artificial e ainda não foi revisado ou verificado

Destaques do diário

Adaptativo Algoritmos Numéricos Avançados Armazenamento de dados Arquiteturas de computação avançadas Banda larga e redes inteligentes Bioinformática e Biologia Computacional Computação autônoma e sensível ao contexto Computação em grade Estrutura de dados Middleware baseado em agente Padrão de Inteligência Artificial/Reconhecimento de Imagem Protocolo de comunicação CDMA/GSM Rede ad hoc Robótica Segurança de banco de dados Sensores sem fio Sistemas de segurança Software livre Tecnologia Calma Tecnologia de radar

Indexado em

Index Copernicus

Academic Keys

CiteFactor

Cosmos IF

RefSeek

Hamdard University

World Catalogue of Scientific Journals

International Innovative Journal Impact Factor (IIJIF)

International Institute of Organised Research (I2OR)

Cosmos

Veja mais

Revistas Internacionais

Ciências Farmacêuticas Ciências Gerais Ciências Médicas Engenharia

Revista Internacional de Pesquisa Inovadora em Engenharia de Computação e Comunicação

Abstrato

Improving Word Similarity Using PPMIC with Estimates of Word Polysemy

Destaques do diário

Indexado em

Revistas Internacionais

Endereço