Rotulação de sintoma de depressão utilizando aprendizado ativo e processamento de linguagem natural

Passador, Rafael Vinicius Polato

dc.contributor.author	Passador, Rafael Vinicius Polato
dc.date.accessioned	2024-02-15T16:28:49Z
dc.date.available	2024-02-15T16:28:49Z
dc.date.issued	2024-01-31
dc.identifier.citation	PASSADOR, Rafael Vinicius Polato. Rotulação de sintoma de depressão utilizando aprendizado ativo e processamento de linguagem natural. 2024. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19281.	*
dc.identifier.uri	https://repositorio.ufscar.br/handle/ufscar/19281
dc.description.abstract	The approach to caring for psychological disorders, especially depression and anxiety, is seen as one of the current major concerns in mental health. Social networks, such as Twitter, not only allow individuals to maintain contact and promote mutual support, but are also often the subject of research aiming to identify individuals with potential depressive profiles or to classify depressive posts. In this context, it is observed that most of the current Natural Language Processing (NLP) systems operate based on models whose success is closely linked to the quality and amount of specific training data available. However, acquiring substantial amounts of annotated data is generally a costly process, especially considering the arduous and complex nature of labeling for NLP activities. In this scenario, some approaches have been proposed in an attempt to mitigate the cost of generating quality training sets. Active Learning seeks to achieve high accuracy with a reduced number of annotated data, allowing a learning algorithm to suggest which observations the expert should label to be used in the training process. In this project, an initial investigation of active learning strategies using a model commitee in the automatic classification of a symptom of depression (sadness or depressive mood) in Twitter posts is carried out, using the SetembroBR corpus, achieving an F1 value up to 10 percentage points higher with the Consensus Entropy query compared to random sampling.	eng
dc.description.sponsorship	Não recebi financiamento	por
dc.language.iso	por	por
dc.publisher	Universidade Federal de São Carlos	por
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Brazil	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/br/	*
dc.subject	Depressão	por
dc.subject	Twitter	por
dc.subject	Saúde mental	por
dc.subject	Active learning	eng
dc.subject	Aprendizado ativo	por
dc.subject	Depression	eng
dc.subject	Mental health	eng
dc.title	Rotulação de sintoma de depressão utilizando aprendizado ativo e processamento de linguagem natural	por
dc.title.alternative	Labeling symptom of depression using active learning and natural language processing	eng
dc.type	TCC	por
dc.contributor.advisor1	Caseli, Helena de Medeiros
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/6608582057810385	por
dc.contributor.advisor-co1	Paraboni, Ivandré
dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/4979536048261282	por
dc.description.resumo	A abordagem de cuidado dos distúrbios psicológicos, especialmente a depressão e a ansiedade, é vista como uma das maiores preocupações atuais em saúde mental. As redes sociais, como Twitter, não apenas permitem que indivíduos mantenham contato e promovam apoio mútuo, como também são frequentemente objeto de pesquisas que visam identificar indivíduos com potenciais perfis depressivos ou classificar postagens depressivas. Nesse contexto, observa-se que grande parte dos sistemas atuais de Processamento de Linguagem Natural (PLN) opera com base em modelos cujo sucesso está intimamente ligado à qualidade e ao montante de dados de treinamento específicos disponíveis. Contudo, adquirir quantidades substanciais de dados anotados é geralmente um processo custoso, sobretudo considerando a natureza árdua e complexa de rotulação para atividades de PLN. Neste cenário, algumas abordagens foram propostas na tentativa de mitigar o custo de geração de conjuntos de treinamento de qualidade. O Aprendizado Ativo (Active Learning) procura alcançar elevada precisão com um número reduzido de dados anotados, permitindo que um algoritmo de aprendizado sugira quais observações o especialista deve rotular para serem utilizados no processo de treinamento. Neste projeto, realiza-se uma investigação inicial das estratégias de aprendizado ativo utilizando um comitê de modelos na classificação automática de um sintoma de depressão (tristeza ou humor depressivo) em postagens do Twitter, utilizando o corpus SetembroBR, alcançando um valor F1 de até 10 pontos percentuais superior com a query de Consensus Entropy em relação à amostragem aleatória.	por
dc.publisher.initials	UFSCar	por
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO	por
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO	por
dc.publisher.address	Câmpus São Carlos	por
dc.contributor.authorlattes	http://lattes.cnpq.br/8275474576606344	por
dc.publisher.course	Ciência da Computação - CC	por
dc.contributor.authororcid	https://orcid.org/0000-0003-3539-0443	por
dc.contributor.advisor1orcid	https://orcid.org/0000-0003-3996-8599	por
dc.contributor.advisor-co1orcid	https://orcid.org/0000-0002-7270-1477	por

Arquivos deste item

Nome:: TCC___Rafael-revisado.pdf
Tamanho:: 811.0Kb
Formato:: PDF

Visualizar/Abrir

Nome:: license_rdf
Tamanho:: 810bytes
Formato:: application/rdf+xml

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Exceto quando indicado o contrário, a licença deste item é descrito como Attribution-NonCommercial-NoDerivs 3.0 Brazil