Abstrato

EXTRINDO TEXTO SIMPLES DE DOCUMENTO DE PALAVRA CORROMPIDO

Saptarshi Naskar, Souvik Sarkar e Krishnendu Basuli

A conversão de texto é um processo escrito em alguma linguagem de programação cuja principal tarefa é extrair o texto simples do ficheiro fonte fornecido em algum formato e colocar o texto no ficheiro de formato diferente. Neste procedimento de conversão, a extensão do ficheiro será alterada, mas os dados nele contidos permanecerão inalterados no formato e tamanho dos dados reais. Este procedimento de conversão é feito através de alguma linguagem de programação (pode ser escrita em C ou C++ ou alguma outra linguagem de programação), cuja principal tarefa é ler o ficheiro fonte linha a linha (em muitos sistemas lê a caractere) e sempre que o texto apropriado (ou seja, o dado ou caractere válido) é encontrado e, em seguida, copia todo o texto para um formato de ficheiro diferente, permanecendo inalterado o formato do texto que está no ficheiro de origem. Aqui, concebemos o conversor de texto em linguagem de programação C que aceita o formato de ficheiro com extensão . doc, . rtf e também . txt, e extrai o texto simples destes ficheiros e coloca os textos num ficheiro de texto permanecendo inalterado do formato de texto do ficheiro de origem.

Isenção de responsabilidade: Este resumo foi traduzido usando ferramentas de inteligência artificial e ainda não foi revisado ou verificado

Indexado em

Google Scholar
Academic Journals Database
Open J Gate
Academic Keys
ResearchBible
CiteFactor
Electronic Journals Library
RefSeek
Hamdard University
Scholarsteer
International Innovative Journal Impact Factor (IIJIF)
International Institute of Organised Research (I2OR)
Cosmos

Veja mais