Um arcabouço semi-autônomo para treino de modelos de aprendizado de máquina com enfoque em métricas de Fairness [recurso eletrônico]
Thales Eduardo Nazatto
DISSERTAÇÃO
Português
T/UNICAMP N236a
[A semi-autonomic framework for developing machine learning-based applications using Fairness metrics]
Campinas, SP : [s.n.], 2023.
1 recurso online (123 p.) : il., digital, arquivo PDF.
Orientadores: Cecília Mary Fischer Rubira, Leonardo Montecchi
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação
Resumo: O uso crescente de Aprendizado de Máquina em soluções digitais criou condições para o diálogo social sobre vieses e discriminações presentes nos dados, e requeriram a criação de novos algoritmos e métricas de Fairness para garantir decisões mais justas. Entretanto, a análise do Cientista de...
Ver mais
Resumo: O uso crescente de Aprendizado de Máquina em soluções digitais criou condições para o diálogo social sobre vieses e discriminações presentes nos dados, e requeriram a criação de novos algoritmos e métricas de Fairness para garantir decisões mais justas. Entretanto, a análise do Cientista de Dados para obter os melhores modelos é mais complexa pela necessidade de equilibrar o aprimoramento das métricas de Fairness com uma possível queda das métricas de avaliação tradicionais, considerando o contexto, e por uma maior variedade de algoritmos que podem ser utilizados isoladamente ou em conjunto durante o treinamento. Este trabalho apresenta uma solução para o treino destes modelos que é operada de forma semi-autônoma para encontrar configurações mais otimizadas em diferentes contextos, através de um módulo com variados algoritmos pré-implementados e a arquitetura MAPE-K para auxiliar na avaliação do equilíbrio ideal. Foram realizados diversos estudos de caso para determinar a viabilidade da solução proposta na resolução desses problemas e se a solução implementada é extensível a futuros algoritmos sem grandes esforços. Diante desses estudos, foi notado que a solução pode auxiliar o Cientista de Dados a ter melhor compreensão do processo de treinamento, possibilitando estudos de Engenharia de Software no auxílio ao treinamento de modelos confiáveis em Aprendizado de Máquina
Ver menos
Abstract: The growing use of Machine Learning in digital solutions has created conditions for social dialogue on biases and discrimination in data, and has required the creation of new algorithms and Fairness metrics to ensure fairer decisions. However, the Data Scientist's analysis to obtain the...
Ver mais
Abstract: The growing use of Machine Learning in digital solutions has created conditions for social dialogue on biases and discrimination in data, and has required the creation of new algorithms and Fairness metrics to ensure fairer decisions. However, the Data Scientist's analysis to obtain the best models is more complex due to the need to balance the improvement of Fairness metrics with a possible decline in traditional evaluation metrics considering the context, as well as a greater variety of algorithms that can be used independently or in combination during training. This work presents a solution for the training of these models that is operated in a semi-autonomous way to identify more optimized configurations across different contexts, through a module with several pre-implemented algorithms and the MAPE-K architecture to assist in evaluating the ideal balance. Several case studies were conducted to determine the feasibility of the proposed solution in solving these problems and if the implemented solution is extensible to future algorithms with minimal effort. In view of these studies, it was noted that the solution can help the Data Scientist in gaining a better understanding of the training process, enabling Software Engineering studies to help in the training of trustworthy Machine Learning models
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Rubira, Cecília Mary Fischer, 1964-
Orientador
Montecchi, Leonardo, 1982-
Coorientador
Kon, Fabio
Avaliador
Raimundo, Marcos Medeiros, 1988-
Avaliador
Um arcabouço semi-autônomo para treino de modelos de aprendizado de máquina com enfoque em métricas de Fairness [recurso eletrônico]
Thales Eduardo Nazatto
Um arcabouço semi-autônomo para treino de modelos de aprendizado de máquina com enfoque em métricas de Fairness [recurso eletrônico]
Thales Eduardo Nazatto