Personalizing mental health support: a retrieval-based llm approach to conversational agent development

dc.contributor.advisor1Caseli, Helena Medeiros de
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6608582057810385
dc.contributor.authorPassador, Rafael Vinicius Polato
dc.contributor.authorlatteshttp://lattes.cnpq.br/8275474576606344
dc.contributor.refereePapa, João Paulo
dc.contributor.refereeSilva, Altigran Soares da
dc.contributor.refereeLatteshttp://lattes.cnpq.br/9039182932747194
dc.contributor.refereeLatteshttp://lattes.cnpq.br/3405503472010994
dc.date.accessioned2026-05-07T12:52:26Z
dc.date.issued2026-04-24
dc.description.abstractMental health disorders constitute a major global challenge, requiring support solutions that are both accessible and scalable. Conversational agents have emerged as promising tools in this context, but purely generative large language model (LLM) systems remain susceptible to unsupported outputs, weak grounding, and limited adaptation to user-specific context. This work investigates whether combining supervised domain adaptation, guideline-grounded retrieval, and persona-based conditioning improves the quality of emotional-support responses. Three system variants built on the same fine-tuned Llama-3 backbone are compared: a Baseline model controlled through layered prompting, a Hybrid Retrieval-Augmented Generation (RAG) variant grounded in authoritative WHO and NICE mental health guidelines through hybrid retrieval, and a Persona-Based RAG variant that further incorporates persona signs into both retrieval and prompt construction. All variants are protected by a pre-LLM crisis guardrail that short-circuits high-risk inputs and returns a predefined safe response. Evaluation was conducted in a single-turn setting using inputs from mental health datasets associated with multiple persona profiles, and outputs were assessed through both human evaluation and an LLM-as-a-judge protocol under a shared rubric covering empathy, topic adequacy, and personalization. Results from both evaluation sources converge in identifying the Persona-Based RAG variant as the best overall configuration, with the clearest gains in empathy and personalization, while the RAG-only variant remained especially competitive in topic adequacy. These findings indicate that combining grounded retrieval with explicit persona conditioning is a promising strategy for the development of more contextually appropriate and supportive conversational agents for mental health.eng
dc.description.resumoTranstornos de saúde mental constituem um grande desafio global, exigindo soluções de suporte que sejam acessíveis e escaláveis. Agentes conversacionais têm emergido como ferramentas promissoras nesse contexto, mas sistemas baseados exclusivamente em modelos de linguagem de grande porte (LLMs) permanecem suscetíveis a saídas não fundamentadas, baixa ancoragem em conhecimento confiável e limitada adaptação ao contexto do usuário. Este trabalho investiga se a combinação de adaptação de domínio supervisionada, recuperação baseada em diretrizes e condicionamento por personas melhora a qualidade das respostas de suporte emocional. Três variantes, construídas sobre o mesmo backbone Llama-3 ajustado por fine-tuning, são comparadas: um modelo Baseline com prompting em camadas, uma variante Hybrid Retrieval-Augmented Generation (RAG) ancorada em diretrizes de saúde mental da WHO e NICE por meio de recuperação híbrida, e uma variante Persona-Based RAG que incorpora sinais de persona tanto na recuperação quanto na construção do prompt. Todas as variantes são protegidas por um guardrail pré-LLM que intercepta entradas de alto risco e retorna uma resposta segura predefinida. A avaliação foi conduzida em um cenário de turno único, com entradas de datasets de saúde mental associadas a múltiplos perfis de persona. As saídas foram avaliadas por julgamento humano e por um protocolo de LLM-as-a-judge, sob um rubric comum que considera empatia, adequação ao tema e personalização. Os resultados convergem ao identificar a variante Persona-Based RAG como a melhor configuração geral, com ganhos mais claros em empatia e personalização, enquanto o RAG sem personas permaneceu competitivo em adequação ao tema. Esses achados indicam que a combinação de recuperação fundamentada em conhecimento com condicionamento por personas é uma estratégia promissora para o desenvolvimento de agentes conversacionais mais contextualmente adequados para suporte em saúde mental.
dc.identifier.citationPASSADOR, Rafael Vinicius Polato. Personalizing mental health support: a retrieval-based llm approach to conversational agent development. 2026. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2026. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/24064.por
dc.identifier.urihttps://hdl.handle.net/20.500.14289/24064
dc.language.isoeng
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCampus São Carlos
dc.publisher.initialsUFSCar
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCC
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectAgente Conversasional
dc.subjectModelos de Linguagem
dc.subjectPersonalização
dc.subjectSaúde Mental
dc.subjectProcessamento De Linguagem Natural
dc.subjectAprendizado de Máquina
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
dc.subject.ods3. Saúde e Bem-Estar
dc.titlePersonalizing mental health support: a retrieval-based llm approach to conversational agent developmenteng
dc.title.alternativePersonalizando o suporte à saúde mental: uma abordagem baseada em recuperação com llms para o desenvolvimento de agentes conversacionais
dc.typeDissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertacao_do_Mestrado___Rafael_Passador__2026.pdf
Tamanho:
4.28 MB
Formato:
Adobe Portable Document Format