Aprendizado de máquina aplicado ao estudo de subtipos das malignidades mieloides
Fábio Malta de Sá Patroni
TESE
Multilíngua
T/UNICAMP P276a
[Machine learning models applied to the subtypes classification of the myeloid malignancies]
Campinas, SP : [s.n.], 2024.
1 recurso online (171 p.) : il., digital, arquivo PDF.
Orientador: Marcelo Mendes Brandão
Tese (doutorado) - Universidade Estadual de Campinas (UNICAMP), Instituto de Biologia
Resumo: Na ciência de dados diversos métodos são utilizados para analisar grandes volumes de dados (Big Data) e extrair informações valiosas. Tal área é integrada pela estatística, ciência da computação, matemática aplicada e visualização para transformar vastas quantidades de dados em novos...
Ver mais
Resumo: Na ciência de dados diversos métodos são utilizados para analisar grandes volumes de dados (Big Data) e extrair informações valiosas. Tal área é integrada pela estatística, ciência da computação, matemática aplicada e visualização para transformar vastas quantidades de dados em novos insights e conhecimentos. Atualmente, a ciência de dados se subdivide em várias áreas, como a Inteligência Artificial (IA), que, apesar de muitas vezes ser confundida com aprendizado de máquina (ML), é uma área mais abrangente que inclui ML como uma de suas subáreas. Tom Mitchell definiu aprendizado de máquina em 1997 como a capacidade de um programa de computador melhorar seu desempenho em uma tarefa através da experiência. Em outras palavras, um programa é considerado como "aprendendo" se sua performance em uma tarefa melhora com a experiência acumulada. O aprendizado de máquina (ML) envolve o uso de algumas áreas como probabilidade, estatística e álgebra linear, as quais possibilitam o aprendizado de forma automática. Os modelos de ML identificam regras e padrões, tornando-se mais complexos com mais atributos e mais bem ajustados com mais dados observacionais, algo que seria inviável para o cérebro humano processar. Eles podem ser empregados em diversas áreas do conhecimento, como na medicina de precisão, integrando diversos tipos de dados, identificando características importantes e respondendo a questões biológicas aplicáveis na prática médica para compreender doenças humanas. As abordagens de ML visam preencher a lacuna entre a capacidade de gerar grandes volumes de dados e a compreensão dos sistemas biomédicos. As aplicações emergentes prometem um futuro promissor para a integração de dados biomédicos, permitindo novas abordagens baseadas em diferentes modelos de dados e resultados biomédicos. O presente trabalho está dividido em dois capítulos. O primeiro aborda o uso de ML com dados clínicos de pacientes portadores de Malignidades Mieloides, especialmente a Leucemia Mielóide Aguda (LMA), e a Síndrome Mielodisplásica (SMD), evidenciando o potencial desses modelos para entender a doença e seus subtipos. Foi explorado o melhor modelo treinado para cada doença, através do uso de métodos como SHAP e Lime com o objetivo de proporcionar maior interpretabilidade e explicabilidade dos resultados. Esses modelos demonstram potencial para auxiliar na compreensão dessas doenças e fornecer novos insights sobre seus subtipos. O segundo capítulo trata da aplicação de aprendizado de máquina em dados de pacientes com câncer na cavidade oral. Este trabalho resultou em uma publicação que demonstra o potencial de seis glicanos específicos para estratificar pacientes com e sem metástase linfonodal. Este estudo evidencia como modelos de ML podem ser aplicados em diferentes contextos clínicos para melhorar a precisão diagnóstica e as estratégias de tratamento. Em conclusão, a ciência de dados, e em particular o aprendizado de máquina, oferece ferramentas poderosas para transformar dados complexos em conhecimentos acionáveis, com aplicações significativas na área da saúde. O progresso contínuo nesta área promete avanços ainda maiores na personalização e eficácia dos tratamentos médicos, beneficiando pacientes e profissionais de saúde
Ver menos
Abstract: In data science, various methods are used to analyze large volumes of data (Big Data) and extract valuable information. This area integrates statistics, computer science, applied mathematics and visualization to transform vast amounts of data into new insights and knowledge. Today, data...
Ver mais
Abstract: In data science, various methods are used to analyze large volumes of data (Big Data) and extract valuable information. This area integrates statistics, computer science, applied mathematics and visualization to transform vast amounts of data into new insights and knowledge. Today, data science is subdivided into several areas, such as Artificial Intelligence (AI), which, although it is often confused with machine learning (ML), is a broader area that includes ML as one of its subareas. Tom Mitchell defined machine learning in 1997 as the ability of a computer program to improve its performance on a task through experience. In other words, a program is considered to be "learning" if its performance on a task improves with accumulated experience. Machine learning (ML) involves the use of areas such as probability, statistics and linear algebra, which make it possible to learn automatically. ML models identify rules and patterns, becoming more complex with more attributes and better adjusted with more observational data, something that would be unfeasible for the human brain to process. They can be used in various areas of knowledge, such as precision medicine, integrating different types of data, identifying important characteristics and answering biological questions applicable in medical practice to understand human diseases. ML approaches aim to bridge the gap between the ability to generate large volumes of data and the understanding of biomedical systems. Emerging applications promise a promising future for biomedical data integration, enabling new approaches based on different data models and biomedical outcomes. This work is divided into two chapters. The first addresses the use of ML with clinical data from patients with Myeloid Malignancies, especially Acute Myeloid Leukemia (AML), and Myelodysplastic Syndrome (MDS), highlighting the potential of these models to understand the disease and its subtypes. The best trained model for each disease was explored using methods such as SHAP and Lime in order to provide greater interpretability and explainability of the results. These models show the potential to help understand these diseases and provide new insights into their subtypes. The second chapter deals with the application of machine learning to data from patients with cancer of the oral cavity. This work resulted in a publication that demonstrates the potential of six specific glycans to stratify patients with and without lymph node metastasis. This study highlights how ML models can be applied in different clinical contexts to improve diagnostic accuracy and treatment strategies. In conclusion, data science, and in particular machine learning, offers powerful tools for transforming complex data into actionable knowledge, with significant applications in healthcare. Continued progress in this area promises even greater advances in the personalization and effectiveness of medical treatments, benefiting patients and healthcare professionals alike
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Aberto
Brandão, Marcelo Mendes, 1974-
Orientador
Campos, Paula de Melo, 1983-
Avaliador
Maschietto, Mariana, 1980-
Avaliador
Schleder, Gabriel Ravanhani
Avaliador
Oliveira, Paulo Sérgio Lopes de, 1969-
Avaliador
Aprendizado de máquina aplicado ao estudo de subtipos das malignidades mieloides
Fábio Malta de Sá Patroni
Aprendizado de máquina aplicado ao estudo de subtipos das malignidades mieloides
Fábio Malta de Sá Patroni