Detecção de discurso de ódio: análise de modelos clássicos e redes neurais com estratégias de balanceamento

Oliveira, Júlia Aparecida Sousa de

Detecção de discurso de ódio: análise de modelos clássicos e redes neurais com estratégias de balanceamento

dc.contributor.advisor1	Valejo, Alan Demétrius Baria
dc.contributor.advisor1Lattes	https://lattes.cnpq.br/9546164790189830
dc.contributor.author	Oliveira, Júlia Aparecida Sousa de
dc.date.accessioned	2025-07-25T12:30:00Z
dc.date.issued	2025-07-10
dc.description.abstract	With the growth of internet access and, consequently, the expansion of social media, new opportunities for communication, interaction, and information exchange have emerged on a global scale. However, this virtual environment has also enabled the spread of negative content, such as hate speech. Hate speech can be understood as any expression that promotes violence or discrimination against individuals or groups based on characteristics such as race, religion, gender, sexual orientation, among others. In this context, the present study focused on evaluating machine learning models by comparing traditional algorithms and neural networks applied to textual data extracted from social media containing hate speech. Balancing techniques such as class weight, oversampling, and undersampling were employed as a way to handle class imbalance. The results showed that traditional classifiers demonstrated greater consistency in the weighted F-Score and AUC metrics, even in the original scenario without balancing treatment, reaching values above 0.93. On the other hand, neural network-based models, such as MLP, CNN, and LSTM, proved to be more sensitive to the type of balancing, suggesting the need for adjustments to improve their generalization capacity.	eng
dc.description.resumo	Com o crescimento do acesso à internet e consequentemente às redes sociais, surgem novas oportunidades de comunicação, interação e troca de informações numa escala à nível global. Porém, esse ambiente virtual também possibilitou a disseminação de conteúdos negativos como o discurso de ódio. Ele pode ser compreendido como qualquer manifestação que promova a violência e discriminação contra indivíduos ou grupos com base em características como raça, religião, gênero, orientação sexual, etc. Nesse sentido, o presente trabalho teve como foco uma avaliação de modelos de aprendizado de máquina, comparando algoritmos tradicionais e redes neurais aplicados à dados textuais extraídos de redes sociais contendo discurso de ódio. Fez-se uso de técnicas de balanceamento, como class wieght, oversampling e undersampling como maneira de lidar com a diferença da quantidade de observações entre classes. Os resultados demonstraram que os classificadores tradicionais apresentaram maior consistência nas métricas de F-Score ponderado e AUC, mesmo no cenário original sem tratamento de balanceamento, chegando a valores superiores a 0.93. Enquanto que os modelos baseados em redes neurais, como MLP, CNN e LSTM, se mostraram mais sensíveis ao tipo de balanceamento, sugerindo necessidades de ajustes para melhoria da capacidade de generalização.
dc.description.sponsorship	Não recebi financiamento
dc.identifier.citation	OLIVEIRA, Júlia Aparecida Sousa de. Detecção de discurso de ódio: análise de modelos clássicos e redes neurais com estratégias de balanceamento. 2025. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22422.	por
dc.identifier.uri	https://hdl.handle.net/20.500.14289/22422
dc.language.iso	por
dc.publisher	Universidade Federal de São Carlos
dc.publisher.address	Campus São Carlos
dc.publisher.course	Ciência da Computação - CC
dc.publisher.initials	UFSCar
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Brazil	en
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subject	Aiscurso de ódio
dc.subject	Aprendizado de máquina
dc.subject	Balanceamento de classes
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
dc.title	Detecção de discurso de ódio: análise de modelos clássicos e redes neurais com estratégias de balanceamento
dc.title.alternative	Hate speech detection: analysis of classical models and neural networks with balancing strategies	eng
dc.type	TCC

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: 2025_1_TCC_Julia_Aparecida_Sousa_de_Oliveira.pdf
Tamanho:: 440.03 KB
Formato:: Adobe Portable Document Format

Baixar

Coleções

TCC