Muheet Ahmed Butt, Majid Zaman
Os documentos são fontes de dados que resultam em informação e conhecimento. Processar documentos para extrair o seu conteúdo de forma automatizada é uma tarefa essencial em todos os tipos de organizações para diversas aplicações. A classificação dos documentos em processamento é necessária para o seu reconhecimento eficiente, uma vez que reduz o número de pesquisas e reduz também as probabilidades de erros nas diferentes fases do processo. Assim sendo, esta proposta de investigação é apresentado um mecanismo de classificação robusto para imagens de documentos baseado na estrutura de layout dos seus diferentes elementos que resulta no reconhecimento baseado na cognição. Considere-se que a imagem do documento contém apenas texto ou texto, bem como tabelas e imagens. A classificação baseia-se num esquema de preservação da estrutura de layout de uma imagem de documento. Os algoritmos baseiam-se nas relações espaciais existentes entre os componentes visuais presentes no documento.