Optimum-path forest in support of collaborative filtering

dc.contributor.advisor1Papa, João Paulo
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/9039182932747194por
dc.contributor.authorMartins, Guilherme Brandão
dc.contributor.authorlatteshttp://lattes.cnpq.br/8300636274454060por
dc.contributor.authororcidhttps://orcid.org/0000-0003-2842-7850por
dc.date.accessioned2024-07-11T12:05:09Z
dc.date.available2024-07-11T12:05:09Z
dc.date.issued2023-12-07
dc.description.abstractMachine learning algorithms are being applied in various computational challenges, among which Recommender Systems (RS) present a range of techniques and approaches to effectively manage large volumes of data and provide personalized and relevant content to users. Such systems must be able to handle data-related issues such as sparsity, scalability, and the cold start problem and Collaborative Filtering (CF) has traditionally been the primary strategy for addressing those challenges. One way to tackled those problems and improve recommendation results is by leveraging auxiliary information sources to compensate the lack of CF data, such as user-item interactions. However, different interpretations of the mentioned problems should be explored. The current work contributes in the field of machine learning by proposing approaches to address the mentioned challenges. This thesis presents a collection of works developed by the author throughout the research period, which have been published or submitted up to the present, encompassing: (i) a systematic literature review which analyzes and discuss recent deep learning approaches employed for CF under sparse-related conditions, while also identifying the challenges and limitations within the field; (ii) a Matrix Factorization (MF)-based ap- proach that leverages CF-related sparsity for the purpose of classifiers fusion; (iii) an alternative unsupervised Optimum-Path Forest (OPF) designed to perform efficiently in large-scale datasets by employing k-approximate-nearest-neighbors graph as its adjacency relation; and (iv) an OPF clustering model built upon the shared-neighborhood concept to alleviate sparsity and high dimensionality issues during CF-based recommendation. The experimental results achieved through such works corroborate the hypotheses of the present thesis.eng
dc.description.resumoAlgoritmos de aprendizado de máquina têm sido aplicados em diversos desafios computacionais, dentre os quais Sistemas Recomendadores (do inglês, Recommender Systems, RS) contém um conjunto de técnicas e abordagens para lidar efetivamente com extensos volumes de dados e oferecer conteúdos personalizados e relevantes aos usuários. Tais sistemas devem ser capazes de lidar com problemas relativos aos dados, como esparsidade, escalabilidade e cold start, e a Filtragem Colaborativa (do inglês, Collaborative Filtering, CF) tradicionalmente tem sido a principal estratégia para lidar com esses desafios. Uma das maneiras de aprimorar os resultados de recomendação é utilizar fontes auxiliares de informação para compensar a falta de dados de CF, como interações usuário-item. Todavia, diferentes interpretações acerca dos problemas mencionados poderiam ser exploradas. O presente trabalho contribui na área de aprendizado de máquina propondo abordagens para lidar com os desafios supracitados. Esta tese é constituída por uma coletânea de trabalhos desenvolvidos pelo autor durante o período de pesquisa, que foram publicados ou submetidos até a atualidade, apresentando: (i) uma revisão sistemática da literatura que analisa e discute abordagens recentes baseadas em aprendizagem profunda para recomendação sob condições de esparsidade, além de identificar desafios e limitações na área de CF; (ii) uma abordagem baseada em Fatoração de Matriz (do inglês, Matrix Factorization, MF ) que explora esparsidade relativa a CF para fusão de classificadores; (iii) um modelo alternativo do classificador não-supervisionado Floresta de Caminhos Ótimos (do inglês, Optimum-Path Forest, OPF ) projetado para operar eficientemente em conjuntos de dados de grande escala, utilizando relação de adjacência baseada em grafo de k-vizinhos-aproximados; e (iv) um modelo OPF para agrupamento de dados baseado no conceito de vizinhança compartilhada para aliviar esparsidade e alta dimensionalidade durante a recomendação baseada em CF. Os resultados experimentais alcançados por meio de tais trabalhos corroboram as hipóteses da presente tese.por
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)por
dc.description.sponsorshipIdCAPES: Código de financiamento 001por
dc.identifier.citationMARTINS, Guilherme Brandão. Optimum-path forest in support of collaborative filtering. 2023. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/19885.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/20.500.14289/19885
dc.language.isoengpor
dc.publisherUniversidade Federal de São Carlospor
dc.publisher.addressCâmpus São Carlospor
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCCpor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectFloresta de caminhos ótimospor
dc.subjectFiltragem colaborativapor
dc.subjectEsparsidadepor
dc.subjectOptimum-path foresteng
dc.subjectCollaborative filteringeng
dc.subjectSparsityeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOpor
dc.titleOptimum-path forest in support of collaborative filteringeng
dc.title.alternativeFloresta de caminhos ótimos no auxílio a filtragem colaborativapor
dc.typeTesepor

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
tese-guilhermebrandaomartins.pdf
Tamanho:
6.29 MB
Formato:
Adobe Portable Document Format
Descrição:
Tese de doutorado - Guilherme Brandão Martins