Topic modeling influence on sentiment analysis from user-generated product reviews
Patrick Anderson Matias de Araújo
DISSERTAÇÃO
Inglês
T/UNICAMP Ar15t
[Influência da modelagem de tópicos na análise de sentimentos a partir de avaliações de produtos geradas por usuários]
Campinas, SP : [s.n.], 2024.
1 recurso online (104 p.) : il., digital, arquivo PDF.
Orientadores: Julio Cesar dos Reis, Marcelo da Silva Reis
Dissertação (mestrado) - Universidade Estadual de Campinas (UNICAMP), Instituto de Computação
Resumo: Na atual economia baseada em dados, entender o feedback do cliente é crucial para que as empresas melhorem seus produtos e serviços. As avaliações de usuários, que representam uma forma moderna de marketing boca a boca, oferecem insights valiosos, mas geralmente são vastas e desafiadoras de...
Ver mais
Resumo: Na atual economia baseada em dados, entender o feedback do cliente é crucial para que as empresas melhorem seus produtos e serviços. As avaliações de usuários, que representam uma forma moderna de marketing boca a boca, oferecem insights valiosos, mas geralmente são vastas e desafiadoras de interpretar manualmente. Técnicas avançadas de processamento de linguagem natural (PLN) fornecem uma maneira de extrair automaticamente insights significativos dos dados, transformando a maneira como as empresas alavancam a entrada do cliente para conduzir decisões estratégicas. Nesse contexto, abordar a identificação de tópicos e a análise de sentimentos em textos é crucial. No entanto, a complexidade de integrar a modelagem de tópicos e a análise de sentimentos como duas técnicas essenciais de PNL apresenta desafios, especialmente quando aplicadas a conjuntos de dados em larga escala com características linguísticas diversificadas e linguagens informais, como sarcasmo, gíria e comentários multilíngues. Esta dissertação de mestrado investiga a integração da modelagem de tópicos e da análise de sentimentos para aprimorar a interpretação de críticas de clientes. Com foco nas avaliações de usuários de três plataformas principais — Amazon, Netflix e Spotify — coletadas por meio da Google Play Store, nosso estudo alavanca técnicas avançadas de processamento de linguagem natural para extrair informações importantes dos comentários dos usuários. Em particular, avaliamos duas abordagens: 1) usando modelos menores de PNL e ajuste fino, como BERT, T5 e BERTopic; 2) usando modelos de transformadores pré-treinados grandes, como Llama 3 8B da Meta e Mixtral 8x7B. Nossa investigação avalia como a modelagem de tópicos afeta a classificação de sentimentos em configurações de várias classes, examinando suas métricas (3 classes vs. 5 classes). A pesquisa destaca a eficácia de diferentes modelos de PNL, que fornecem às empresas entendimentos mais profundos sobre o comportamento do cliente e permitem decisões estratégicas baseadas em dados. Esta dissertação de mestrado contribui ao demonstrar a relevância de combinar modelagem de tópicos com análise de sentimentos, avançando a aplicação de IA em inteligência de negócios
Ver menos
Abstract: In today's data-driven economy, understanding customer feedback is crucial for businesses to improve their products and services. User reviews, representing a modern form of word-of-mouth marketing, offer valuable insights but are often vast and challenging to interpret manually. Advanced...
Ver mais
Abstract: In today's data-driven economy, understanding customer feedback is crucial for businesses to improve their products and services. User reviews, representing a modern form of word-of-mouth marketing, offer valuable insights but are often vast and challenging to interpret manually. Advanced natural language processing (NLP) techniques provide a way to automatically extract meaningful insights from data, transforming how companies leverage customer input to drive strategic decisions. In this context, addressing topic identification and sentiment analysis in texts is crucial. However, the complexity of integrating topic modeling and sentiment analysis as two essential NLP techniques presents challenges, especially when applied to large-scale datasets with diversified linguistic features and informal languages, such as sarcasm, slang, and multilingual comments. This M.Sc. dissertation investigates the integration of topic modeling and sentiment analysis to enhance the interpretation of customer feedback. Focusing on user reviews from three major platforms — Amazon, Netflix, and Spotify — collected via the Google Play Store, our study leverages advanced natural language processing techniques to extract key information from user comments. In particular, we evaluate two approaches: 1) small fine-tuned NLP models such as BERT, T5, and BERTopic; 2) pre-trained large transformer models like Meta's Llama 3 8B and Mixtral 8x7B. Our investigation assesses how topic modeling affects sentiment classification across multi-class settings, examining its metrics (3 classes vs. 5 classes). Our research highlights the effectiveness of different NLP models, which give businesses a deeper understanding of customer behavior and enable data-driven strategic decisions. This M.Sc. dissertation contributes by demonstrating the relevance of combining topic modeling with sentiment analysis, advancing the application of AI in business intelligence
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Aberto
Reis, Julio Cesar dos, 1987-
Orientador
Reis, Marcelo da Silva, 1979-
Coorientador
Maia, Helena de Almeida, 1992-
Avaliador
Silva, Thiago Henrique
Avaliador
Topic modeling influence on sentiment analysis from user-generated product reviews
Patrick Anderson Matias de Araújo
Topic modeling influence on sentiment analysis from user-generated product reviews
Patrick Anderson Matias de Araújo