Detecção de discurso de ódio: análise de modelos clássicos e redes neurais com estratégias de balanceamento

dc.contributor.advisor1Baria Valejo, Alan Demétrius
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/9546164790189830
dc.contributor.authorOliveira, Júlia Aparecida Sousa de
dc.date.accessioned2025-07-25T12:30:00Z
dc.date.issued2025-07-10
dc.description.abstractWith the growth of internet access and, consequently, the expansion of social media, new opportunities for communication, interaction, and information exchange have emerged on a global scale. However, this virtual environment has also enabled the spread of negative content, such as hate speech. Hate speech can be understood as any expression that promotes violence or discrimination against individuals or groups based on characteristics such as race, religion, gender, sexual orientation, among others. In this context, the present study focused on evaluating machine learning models by comparing traditional algorithms and neural networks applied to textual data extracted from social media containing hate speech. Balancing techniques such as class weight, oversampling, and undersampling were employed as a way to handle class imbalance. The results showed that traditional classifiers demonstrated greater consistency in the weighted F-Score and AUC metrics, even in the original scenario without balancing treatment, reaching values above 0.93. On the other hand, neural network-based models, such as MLP, CNN, and LSTM, proved to be more sensitive to the type of balancing, suggesting the need for adjustments to improve their generalization capacity.eng
dc.description.resumoCom o crescimento do acesso à internet e consequentemente às redes sociais, surgem novas oportunidades de comunicação, interação e troca de informações numa escala à nível global. Porém, esse ambiente virtual também possibilitou a disseminação de conteúdos negativos como o discurso de ódio. Ele pode ser compreendido como qualquer manifestação que promova a violência e discriminação contra indivíduos ou grupos com base em características como raça, religião, gênero, orientação sexual, etc. Nesse sentido, o presente trabalho teve como foco uma avaliação de modelos de aprendizado de máquina, comparando algoritmos tradicionais e redes neurais aplicados à dados textuais extraídos de redes sociais contendo discurso de ódio. Fez-se uso de técnicas de balanceamento, como class wieght, oversampling e undersampling como maneira de lidar com a diferença da quantidade de observações entre classes. Os resultados demonstraram que os classificadores tradicionais apresentaram maior consistência nas métricas de F-Score ponderado e AUC, mesmo no cenário original sem tratamento de balanceamento, chegando a valores superiores a 0.93. Enquanto que os modelos baseados em redes neurais, como MLP, CNN e LSTM, se mostraram mais sensíveis ao tipo de balanceamento, sugerindo necessidades de ajustes para melhoria da capacidade de generalização.
dc.description.sponsorshipNão recebi financiamento
dc.identifier.citationOLIVEIRA, Júlia Aparecida Sousa de. Detecção de discurso de ódio: análise de modelos clássicos e redes neurais com estratégias de balanceamento. 2025. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22422.por
dc.identifier.urihttps://hdl.handle.net/20.500.14289/22422
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCampus São Carlos
dc.publisher.courseCiência da Computação - CC
dc.publisher.initialsUFSCar
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectAiscurso de ódio
dc.subjectAprendizado de máquina
dc.subjectBalanceamento de classes
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
dc.titleDetecção de discurso de ódio: análise de modelos clássicos e redes neurais com estratégias de balanceamento
dc.title.alternativeHate speech detection: analysis of classical models and neural networks with balancing strategieseng
dc.typeTCC

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
2025_1_TCC_Julia_Aparecida_Sousa_de_Oliveira.pdf
Tamanho:
440.03 KB
Formato:
Adobe Portable Document Format

Coleções