Machine learning methods applied to COVID-19 patient data = Métodos de aprendizado de máquina aplicados a dados de pacientes de COVID-19
Vitor Pereira Bezzan
DISSERTAÇÃO
Inglês
T/UNICAMP B469m
[Métodos de aprendizado de máquina aplicados a dados de pacientes de COVID-19]
Campinas, SP : [s.n.], 2021.
1 recurso online (55 p.) : il., digital, arquivo PDF.
Orientador: Cleber Damião Rocco
Dissertação (mestrado profissional) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica
Resumo: Apresentamos aqui o resultado final de dois artigos que são resultados de uma pesquisa do uso de aprendizado de máquina (machine learning) em dados de pacientes acometidos pela doença COVID-19. No primeiro artigo, nos concentramos em desenvolver um modelo de previsão que fosse capaz de...
Ver mais
Resumo: Apresentamos aqui o resultado final de dois artigos que são resultados de uma pesquisa do uso de aprendizado de máquina (machine learning) em dados de pacientes acometidos pela doença COVID-19. No primeiro artigo, nos concentramos em desenvolver um modelo de previsão que fosse capaz de prever a gravidade de um dado paciente de COVID-19 e o número total de dias que este mesmo paciente pudesse ficar internado (em regime ambulatorial ou tratamento intensivo) usando-se para isso dados advindos de exames de sangue. Para tanto, foram utilizadas técnicas de modelagem desenvolvidas recentemente como modelos de ensemble de árvores e otimização bayesiana para seleção de modelos entre vários candidatos. Os resultados finais apontam modelos com 0.94 para a área sob a curva ROC para o classificador estimado e 1.87 de erro quadrático médio (uma melhora de 77% sobre o cenário de base) para o regressor estimado. No segundo artigo, apresentamos o uso de aprendizado não-supervisionado baseado na com- binação de uma técnica de redução dimensional (UMAP - Uniform Manifold Approximation and Projection for Dimension Reduction) com algoritmo de clusterização DBSCAN em dados oriundos de exames de sangue de pacientes infectados com COVID-19. Com isso, foi possível explicitar diferentes grupos com variadas possíveis manifestações da doença (prevalências entre 2-37%). Além disso, fomos capazes de afirmar que existe evidência observacional (não-causal) de que a doença afeta principalmente a série branca do sangue (associada aos processos de coagulação e imunidade). Os dois artigos em conjunto permitem estabelecer relações observacionais (não-causais) fortes sobre a real natureza da infecção por SARS-Cov-2 caudador da COVID-19, que parece não ser somente de natureza respiratória, mas multi-sistêmica com implicações nos sistemas imune e plaquetário
Ver menos
Abstract: We present here the final result of two articles that are the results of a research on the use of machine learning in data from patients affected by the disease COVID-19. In the first article, we focused on developing a predictive model that would predict a given COVID-19 patient's...
Ver mais
Abstract: We present here the final result of two articles that are the results of a research on the use of machine learning in data from patients affected by the disease COVID-19. In the first article, we focused on developing a predictive model that would predict a given COVID-19 patient's severity and the total number of days that the same patient could be hospitalized (on an outpatient or intensive care basis) using data from blood tests. For this, we have used modeling techniques such as tree ensemble models and Bayesian optimization for model selection among several candidates. The final results point to models with 0.94 for the area under the ROC curve for the estimated classifier and 1.87 for the mean squared error (an improvement of 77% over the baseline scenario) for the estimated regressor. In the second article, we present unsupervised learning based on the combination of a dimension reduction technique (UMAP - Uniform Manifold Approximation and Projection for Dimension Reduction) with DBSCAN clustering algorithm in data from blood tests of patients infected with COVID-19. Thus, it was possible to explain different groups with different disease manifestations (prevalence between 2-37 %). Also, we were able to claim that there is observational (non-causal) evidence that the disease primarily affects the white blood series (associated with clotting and immunity processes). The two articles taken together make it possible to establish solid observational (non-causal) relationships about the fundamental nature of COVID-19 infection, which appears to be not only a respiratory but of multi-systemic nature with implications for the immune and platelet systems
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Aberto
Rocco, Cleber Damião, 1980-
Orientador
Yasuda, Clarissa Lin, 1975-
Avaliador
Avila, Sandra Eliza Fontes de, 1982-
Avaliador
Machine learning methods applied to COVID-19 patient data = Métodos de aprendizado de máquina aplicados a dados de pacientes de COVID-19
Vitor Pereira Bezzan
Machine learning methods applied to COVID-19 patient data = Métodos de aprendizado de máquina aplicados a dados de pacientes de COVID-19
Vitor Pereira Bezzan