Show simple item record

dc.contributor.authorPassador, Rafael Vinicius Polato
dc.date.accessioned2024-02-15T16:28:49Z
dc.date.available2024-02-15T16:28:49Z
dc.date.issued2024-01-31
dc.identifier.citationPASSADOR, Rafael Vinicius Polato. Rotulação de sintoma de depressão utilizando aprendizado ativo e processamento de linguagem natural. 2024. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19281.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/19281
dc.description.abstractThe approach to caring for psychological disorders, especially depression and anxiety, is seen as one of the current major concerns in mental health. Social networks, such as Twitter, not only allow individuals to maintain contact and promote mutual support, but are also often the subject of research aiming to identify individuals with potential depressive profiles or to classify depressive posts. In this context, it is observed that most of the current Natural Language Processing (NLP) systems operate based on models whose success is closely linked to the quality and amount of specific training data available. However, acquiring substantial amounts of annotated data is generally a costly process, especially considering the arduous and complex nature of labeling for NLP activities. In this scenario, some approaches have been proposed in an attempt to mitigate the cost of generating quality training sets. Active Learning seeks to achieve high accuracy with a reduced number of annotated data, allowing a learning algorithm to suggest which observations the expert should label to be used in the training process. In this project, an initial investigation of active learning strategies using a model commitee in the automatic classification of a symptom of depression (sadness or depressive mood) in Twitter posts is carried out, using the SetembroBR corpus, achieving an F1 value up to 10 percentage points higher with the Consensus Entropy query compared to random sampling.eng
dc.description.sponsorshipNão recebi financiamentopor
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectDepressãopor
dc.subjectTwitterpor
dc.subjectSaúde mentalpor
dc.subjectActive learningeng
dc.subjectAprendizado ativopor
dc.subjectDepressioneng
dc.subjectMental healtheng
dc.titleRotulação de sintoma de depressão utilizando aprendizado ativo e processamento de linguagem naturalpor
dc.title.alternativeLabeling symptom of depression using active learning and natural language processingeng
dc.typeTCCpor
dc.contributor.advisor1Caseli, Helena de Medeiros
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6608582057810385por
dc.contributor.advisor-co1Paraboni, Ivandré
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/4979536048261282por
dc.description.resumoA abordagem de cuidado dos distúrbios psicológicos, especialmente a depressão e a ansiedade, é vista como uma das maiores preocupações atuais em saúde mental. As redes sociais, como Twitter, não apenas permitem que indivíduos mantenham contato e promovam apoio mútuo, como também são frequentemente objeto de pesquisas que visam identificar indivíduos com potenciais perfis depressivos ou classificar postagens depressivas. Nesse contexto, observa-se que grande parte dos sistemas atuais de Processamento de Linguagem Natural (PLN) opera com base em modelos cujo sucesso está intimamente ligado à qualidade e ao montante de dados de treinamento específicos disponíveis. Contudo, adquirir quantidades substanciais de dados anotados é geralmente um processo custoso, sobretudo considerando a natureza árdua e complexa de rotulação para atividades de PLN. Neste cenário, algumas abordagens foram propostas na tentativa de mitigar o custo de geração de conjuntos de treinamento de qualidade. O Aprendizado Ativo (Active Learning) procura alcançar elevada precisão com um número reduzido de dados anotados, permitindo que um algoritmo de aprendizado sugira quais observações o especialista deve rotular para serem utilizados no processo de treinamento. Neste projeto, realiza-se uma investigação inicial das estratégias de aprendizado ativo utilizando um comitê de modelos na classificação automática de um sintoma de depressão (tristeza ou humor depressivo) em postagens do Twitter, utilizando o corpus SetembroBR, alcançando um valor F1 de até 10 pontos percentuais superior com a query de Consensus Entropy em relação à amostragem aleatória.por
dc.publisher.initialsUFSCarpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOpor
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/8275474576606344por
dc.publisher.courseCiência da Computação - CCpor
dc.contributor.authororcidhttps://orcid.org/0000-0003-3539-0443por
dc.contributor.advisor1orcidhttps://orcid.org/0000-0003-3996-8599por
dc.contributor.advisor-co1orcidhttps://orcid.org/0000-0002-7270-1477por


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Brazil
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 Brazil