Mostrar el registro sencillo del ítem

dc.contributor.authorSantos, Allisfrank dos
dc.date.accessioned2024-09-05T11:49:41Z
dc.date.available2024-09-05T11:49:41Z
dc.date.issued2019-02-28
dc.identifier.citationSANTOS, Allisfrank dos. Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/ufscar/20474.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/20474
dc.description.abstractIn the globalized world, the analysis of data generated from the most varied sources, especially the textual ones, has become of great importance for the acquisition of knowledge and information. In this respect, the Internet and social networks make up the main textual database. The Sentiment Analysis is a form of data mining in text format, and the purpose of this type of analysis is to identify and / or analyze users' opinions about an entity or about sentiment related to various topics. Several researchers have used the Sentiment Analysis to understand user behavior through polarity, which can be separated into two or three classes. However, the challenge ahead is to find ways that go beyond the traditional classification and achieve a more real analysis of the expressed feelings, exploring t he idea of multiclass analysis (through emotional classes). Based on these facts, this paper aims to study aspects of the Sentiment Analysis related to the number of classes of emotions to be analyzed, as well as the representation form of the texts to be submitted for classification. For this, classic Machine Learning algorithms (SVM, kNN and Naive Bayes) as well as vectorization techniques such as TF - IDF and Word2Vec were used. The results show that a reduced number of classes allied to the use of Word2Vec as a textual representation method improves the classification result, especially with the use of the SVM classifier, obtaining an accuracy of 58.8% for the emotional base and 68.6% for the basis of polarity.eng
dc.description.sponsorshipNão recebi financiamentopor
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAttribution-ShareAlike 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-sa/3.0/br/*
dc.subjectAnálise de sentimentospor
dc.subjectAprendizado de máquinapor
dc.subjectPolaridadepor
dc.subjectEmoçõespor
dc.subjectClassificaçãopor
dc.subjectSentiment analysiseng
dc.subjectMachine learningeng
dc.subjectPolarityeng
dc.subjectEmotioneng
dc.subjectClassificationeng
dc.titleAnálise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquinapor
dc.title.alternativeMulticlass sentiment analysis: a comprehensive approach the use of machine learningpor
dc.typeDissertaçãopor
dc.contributor.advisor1Camargo, Heloisa de Arruda
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0487231065057783por
dc.description.resumoNo mundo globalizado, a análise de dados, principalmente os textuais, tem se tornado de grande importância para aquisição de conhecimento e informação a partir de dados gerados das mais variadas fontes de dados. Neste aspecto, a internet e as redes sociais compõem a principal base de dados textuais. A Análise de Sentimento é uma forma de mineração de dados na forma de texto, sendo que este tipo de análise visa identificar e/ou analisar a opinião dos usuários sobre uma entidade ou sobre os sentimentos em relação a temas variados. Diversos pesquisadores têm utilizado a Análise de Sentimento para compreender o comportamento dos usuários por meio da polaridade, que podem ser em duas ou três classes. Entretanto, o desafio que se coloca é encontrar meios que ultrapassem a classificação tradicional e conseguir fazer uma análise mais real dos sentimentos expressos, explorando a ideia de análise multiclasse (por meio de classes emocionais). Partindo desses fatos, esse trabalho tem por objetivo estudar aspectos da Análise de Sentimentos com relação ao número de classes de emoções a serem analisadas, bem como a forma de representação dos textos a serem submetidos para classificação. Para isso, foram utilizados algoritmos clássicos de Aprendizado de Máquina (SVM, kNN e Naive Bayes) e uso de técnicas de vetorização como TF - IDF e Word2Vec. Os resultados encontrados mostram que um número reduzido de classes aliado ao uso de Word2Vec como método de representação textual melhoram o resultado da classificação, principalmente com o uso do classificador SVM, obtendo uma acurácia de 58.8% para a base emocional e 68.6% para a base de polaridade.por
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCCpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOpor
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/5684740301746085por


Ficheros en el ítem

Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Attribution-ShareAlike 3.0 Brazil
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-ShareAlike 3.0 Brazil