Classificação de gênero social em padrões vocais utilizando redes neurais artificiais
Ber dos Santos Neves
DISSERTAÇÃO
Português
T/UNICAMP N414c
[Social gender classification in vocal patterns using artificial neural networks]
Campinas, SP : [s.n.], 2024.
1 recurso online (55 p.) : il., digital, arquivo PDF.
Orientadores: Romis Ribeiro de Faissol Attux, Ana Carolina Constantini
Dissertação (mestrado) - Universidade Estadual de Campinas (UNICAMP), Faculdade de Engenharia Elétrica e de Computação
Resumo: Através da reflexão filosófica e linguística sobre os fundamentos da voz e do gênero, o presente trabalho propôs um problema de classificação inovador, o qual busca situar e comparar as vozes transgêneras e cisgêneras em relação aos seus atributos. Para tal, foi analisado um classificador de...
Ver mais
Resumo: Através da reflexão filosófica e linguística sobre os fundamentos da voz e do gênero, o presente trabalho propôs um problema de classificação inovador, o qual busca situar e comparar as vozes transgêneras e cisgêneras em relação aos seus atributos. Para tal, foi analisado um classificador de voz baseado no modelo Wav2Vec2, treinado para categorizar vozes em "male", "female" e "other". O modelo foi treinado por 7 épocas com CrossEntropyLoss e SGD. Avaliou-se o desempenho com matrizes de confusão, curvas ROC e AUC. A técnica de redução de dimensionalidade t-SNE foi usada para visualizar as representações internas do modelo. Os resultados mostram que o modelo classifica vozes de maneira robusta, com uma análise detalhada das suas capacidades discriminatórias, entretanto, não obteu-se boa precisão para a classe "other"
Ver menos
Abstract: Through philosophical and linguistic reflection on the foundations of voice and gender, this work proposed an innovative classification problem that seeks to position and compare transgender and cisgender voices in relation to their attributes. \par To achieve this, a voice classifier...
Ver mais
Abstract: Through philosophical and linguistic reflection on the foundations of voice and gender, this work proposed an innovative classification problem that seeks to position and compare transgender and cisgender voices in relation to their attributes. \par To achieve this, a voice classifier based on the Wav2Vec2 model was analyzed, trained to categorize voices as "male," "female," and "other." The model was trained for 7 epochs using CrossEntropyLoss and SGD. Its performance was evaluated using confusion matrices, ROC curves, and AUC. The t-SNE dimensionality reduction technique was used to visualize the model's internal representations. The results show that the model classifies voices robustly, with a detailed analysis of its discriminatory capabilities; however, it did not achieve good accuracy for the "other" class
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Aberto
Attux, Romis Ribeiro de Faissol, 1978-
Orientador
Constantini, Ana Carolina, 1985-
Coorientador
Boccato, Levy, 1986-
Avaliador
Lopes, Leonardo
Avaliador
Classificação de gênero social em padrões vocais utilizando redes neurais artificiais
Ber dos Santos Neves
Classificação de gênero social em padrões vocais utilizando redes neurais artificiais
Ber dos Santos Neves