Abstrato

Machine Learning 2018: Utilização de plataforma de cloud genómica e aprendizagem automática para análise de variantes do genoma - Tilila El Moujahid-Microsoft

Tilila El Moujahid

O sequenciamento de ponta (NGS) permite a realização de sequenciamento de ADN altamente paralelo e está atualmente a reformar as investigações orgânicas. Em vez de sequenciar exclusivamente um conjunto específico de qualidades, o NGS permite agrupar uma parte mais extensa do genoma (até mesmo um genoma inteiro), o que abre a porta de entrada para uma investigação mais extensa das vias orgânicas dentro de uma pessoa. Nunca antes os analistas chegaram a uma tal abundância de informação genómica que garanta a revelação de conhecimentos privilegiados sobre as doenças mais devastadoras do século, por exemplo, o crescimento maligno. Também traz o seu próprio conjunto de dificuldades para a gestão e investigação de Big Data para remover fragmentos importantes e significativos de conhecimento. A computação distribuída e a IA têm a capacidade de explicar este teste. Nesta discussão, mostraremos como o estágio de genómica baseado na nuvem permite supervisionar petabytes de informação genómica, além de incentivar a análise secundária rápida e ágil. Da mesma forma, utilizaremos pacotes de IA explícitos de genómica para realizar análises terciárias em informações de variações de qualidade e aparelhos de representação para descobrir e transmitir os resultados à rede científica. Iniciaremos a discussão com o prólogo ao campo da genómica e ao processo de exame genómico normalmente utilizado e apresentaremos os usos práticos das administrações e investigações acima referidas. A capacidade de sequenciar o ADN proporciona aos investigadores o poder de “ler” o modelo genético que dirige todas as atividades de um organismo vivo. Para contextualizar, o dogma central da biologia é resumido como o caminho do ADN para o ARN e para a proteína. O ADN é composto por pares de bases, tendo por base 4 unidades básicas (A, C, G e T) denominadas nucleótidos: A pares com T e C pares com G. O ADN está organizado em cromossomas e os humanos têm um total de 23 pares. Os cromossomas estão ainda organizados em segmentos de ADN denominados genes que produzem ou codificam proteínas. A soma dos genes que um organismo possui designa-se por genoma. Os humanos têm cerca de 20 mil genes e três mil milhões de pares de bases. Curiosamente, apenas cerca de 2 por cento do genoma humano codifica proteínas e esta é muitas vezes uma área chave de foco na investigação e, portanto, no negócio da genómica. A genómica está intimamente relacionada com a medicina de precisão. Com um tamanho de mercado projetado para atingir os 87 mil milhões de dólares até 2023, o campo da Medicina de Precisão (também conhecida como medicina personalizada) é uma abordagem aos cuidados ao paciente que abrange a genética, o comportamento e o ambiente com o objetivo de implementar uma intervenção de tratamento específica do doente ou da população. em contraste com uma abordagem de tamanho único. Por exemplo, para reduzir o risco de complicações, um indivíduo que necessite de uma transfusão seria combinado com um dador que partilhasse o mesmo grupo sanguíneo, em vez de um dador selecionado aleatoriamente. Atualmente, existem duas barreiras principais para uma maior implementação da medicina de precisão: custos elevados e limitações tecnológicas.Para lidar com a grande quantidade de dados de doentes que precisam de ser recolhidos e analisados, e para ajudar a reduzir os custos, muitos investigadores estão a implementar técnicas de aprendizagem automática Felizmente para os investigadores e empresas de genómica, o valor da sequenciação de um genoma continua a descer ano após ano. -ano – mesmo depois de uma enorme descida relativa dos custos entre 2007 e 2012.

Biografia:

Tilila é atualmente Cientista de Dados e Evangelista Técnica de dados e IA a trabalhar na Microsoft. Acompanha os parceiros na arquitetura e construção das suas soluções baseadas na cloud e alimentadas por IA. Anteriormente, foi estratega de tecnologia para contas empresariais, incluindo o setor da educação e da saúde. É também bolseira Fulbright e obteve, em 2012, um mestrado em Ciência da Computação e Negócios pela Universidade Estadual de São Francisco, onde o seu foco era a Bioinformática, incluindo Genómica e Análise de Imagens Biomédicas.

Isenção de responsabilidade: Este resumo foi traduzido usando ferramentas de inteligência artificial e ainda não foi revisado ou verificado

Indexado em

Google Scholar
Academic Journals Database
Open J Gate
Academic Keys
ResearchBible
CiteFactor
Electronic Journals Library
RefSeek
Hamdard University
Scholarsteer
International Innovative Journal Impact Factor (IIJIF)
International Institute of Organised Research (I2OR)
Cosmos

Veja mais