Abstrato

Data Mining 2016: Análise de dados geométricos: Análise de processos e comportamentos- Fionn Murtagh - University of Derby

Fionn Murtagh

  A análise de dados geométricos permite “deixar os dados falar” e integra análises qualitativas e quantitativas. O âmbito e o potencial são importantes em muitos campos. Os estudos de caso aqui são análises de redes sociais em grande escala, associadas a uma vizinhança de práticas sociais e a uma vizinhança de saúde e bem-estar. A interessante investigação de Keiding e Louis, “Perigos e potenciais da entrada auto-selecionada em estudos e investigação epidemiológica” aponta para questões muito interessantes na análise de big data. A minha contribuição está na parte de discussão deste artigo. Através da geometria e da topologia do conhecimento e do conhecimento, com inclusão de contexto, de cronologia e de modelos de quadros, estamos a abordar tais problemas com amostragem e representatividade. Os estudos de caso a discutir nesta apresentação estão relacionados com a saúde mental e com eventos e contextos de entretenimento social, neste último caso com muitos milhões de tweets no Twitter, em várias línguas. É dada especial atenção à utilização e implementação das nossas perspectivas analíticas. Isto inclui a determinação do conteúdo de conhecimento das nossas nuvens de dados e o mapeamento em espaços de factores semânticos dotados de distância euclidiana, também por causa da topologia ultramétrica ou hierárquica, que é característica de todas as formas de sistemas complexos. . Suppes (Universidade de Stanford) para designar a abordagem da Estatística Multivariada iniciada por Benzécri como Análise de Correspondência, abordagem que se tem vindo a tornar cada vez mais utilizada e apreciada ao longo dos anos. Este livro apresenta a formalização completa do GDA em termos de álgebra - a principal característica original e de longo alcance da abordagem - e mostra também como integrar as ferramentas estatísticas de qualidade como a Análise de Variância, incluindo métodos Bayesianos. O Capítulo 9, Estudos de Casos de Investigação, é quase um livro em si mesmo; apresenta a metodologia em ação em três aplicações extensas, uma para medicina, uma para política e uma para educação (dados emprestados do programa de computador de Stanford para Juventude apresentados). Assim, o público leitor do livro preocupa-se tanto com os matemáticos curiosos sobre as aplicações da matemática como com os investigadores dispostos a dominar uma abordagem excepcionalmente poderosa da análise estatística de dados. de dados, de modo a inferir informação útil e obter insights sobre fenómenos complexos. Numa perspetiva geométrica, quando uma instância (um fenómeno natural, um fenómeno privado, etc.) é dada como uma coleção de tamanho fixo de observações com valor real, é naturalmente identificada com um ponto geométrico que tem essas observações como coordenadas. Qualquer coleção de tais instâncias é então vista como uma nuvem de pontos amostrada em algum espaço métrico ou normado. No entanto,quais as características dominantes da análise massiva de dados? Aqui, a análise refere-se a toda a metodologia, em vez da análise específica individual. Neste artigo são propostas seis técnicas relativas à análise de big data, que incluem: (1) Análise de conjunto associada a um volume descomunal de conhecimento, (2) Análise de associação associada a amostragem de dados desconhecidos, (3) Análise de alta dimensão associada a um difusão do conhecimento, (4) Análise profunda associada à veracidade do conhecimento, (5) Análise de precisão associada à veracidade do conhecimento, e (6) Análise dividir e conquistar associada à velocidade do conhecimento. O essencial da análise de dados massivos é a análise estrutural de dados massivos num critério ideal de física, computação e cognição humana. Fundamentalmente, são colocados dois desafios teóricos, ou seja, a violação da distribuição independente e idêntica e, portanto, a extensão da teoria geral dos conjuntos. Em particular, ilustramos três tipos de associação em big data geográfico, ou seja, associações geométricas no espaço e no tempo, correlações espaço-temporais em estatísticas e relações espaço-temporais em semântica. Além disso, ilustramos três tipos de análise de dados espaço-temporais, ou seja, ajuste de medição (observação) de quantidades geométricas, análise do comportamento espacial humano com trajetórias, assimilação de dados de modelos físicos e várias observações, das quais a análise de big data espaço-temporal também poderia ser amplamente derivada.assimilação de dados de modelos físicos e observações diversas, das quais a análise de big data espaço-temporal também poderia ser derivada em grande parte.assimilação de dados de modelos físicos e observações diversas, das quais a análise de big data espaço-temporal também poderia ser derivada em grande parte.  

Biografia:

Fionn Murtagh é Professor de Ciência de Dados e trabalhou anteriormente em Big Data na Educação, Astrofísica e Cosmologia. Foi o Diretor de Financiamento Nacional de Investigação em vários domínios, incluindo Computação e Engenharia, Energia, Nanotecnologia e Fotónica. Foi professor de Ciência da Computação, incluindo chefe de departamento e chefe de escola em muitas universidades. Foi Editor-Chefe do Computer Journal durante mais de 10 anos e é membro do Conselho Editorial de muitas outras revistas.

Isenção de responsabilidade: Este resumo foi traduzido usando ferramentas de inteligência artificial e ainda não foi revisado ou verificado

Indexado em

Google Scholar
Academic Journals Database
Open J Gate
Academic Keys
ResearchBible
CiteFactor
Electronic Journals Library
RefSeek
Hamdard University
Scholarsteer
International Innovative Journal Impact Factor (IIJIF)
International Institute of Organised Research (I2OR)
Cosmos

Veja mais