Optimum-path forest in support of collaborative filtering
| dc.contributor.advisor1 | Papa, João Paulo | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/9039182932747194 | por |
| dc.contributor.author | Martins, Guilherme Brandão | |
| dc.contributor.authorlattes | http://lattes.cnpq.br/8300636274454060 | por |
| dc.contributor.authororcid | https://orcid.org/0000-0003-2842-7850 | por |
| dc.date.accessioned | 2024-07-11T12:05:09Z | |
| dc.date.available | 2024-07-11T12:05:09Z | |
| dc.date.issued | 2023-12-07 | |
| dc.description.abstract | Machine learning algorithms are being applied in various computational challenges, among which Recommender Systems (RS) present a range of techniques and approaches to effectively manage large volumes of data and provide personalized and relevant content to users. Such systems must be able to handle data-related issues such as sparsity, scalability, and the cold start problem and Collaborative Filtering (CF) has traditionally been the primary strategy for addressing those challenges. One way to tackled those problems and improve recommendation results is by leveraging auxiliary information sources to compensate the lack of CF data, such as user-item interactions. However, different interpretations of the mentioned problems should be explored. The current work contributes in the field of machine learning by proposing approaches to address the mentioned challenges. This thesis presents a collection of works developed by the author throughout the research period, which have been published or submitted up to the present, encompassing: (i) a systematic literature review which analyzes and discuss recent deep learning approaches employed for CF under sparse-related conditions, while also identifying the challenges and limitations within the field; (ii) a Matrix Factorization (MF)-based ap- proach that leverages CF-related sparsity for the purpose of classifiers fusion; (iii) an alternative unsupervised Optimum-Path Forest (OPF) designed to perform efficiently in large-scale datasets by employing k-approximate-nearest-neighbors graph as its adjacency relation; and (iv) an OPF clustering model built upon the shared-neighborhood concept to alleviate sparsity and high dimensionality issues during CF-based recommendation. The experimental results achieved through such works corroborate the hypotheses of the present thesis. | eng |
| dc.description.resumo | Algoritmos de aprendizado de máquina têm sido aplicados em diversos desafios computacionais, dentre os quais Sistemas Recomendadores (do inglês, Recommender Systems, RS) contém um conjunto de técnicas e abordagens para lidar efetivamente com extensos volumes de dados e oferecer conteúdos personalizados e relevantes aos usuários. Tais sistemas devem ser capazes de lidar com problemas relativos aos dados, como esparsidade, escalabilidade e cold start, e a Filtragem Colaborativa (do inglês, Collaborative Filtering, CF) tradicionalmente tem sido a principal estratégia para lidar com esses desafios. Uma das maneiras de aprimorar os resultados de recomendação é utilizar fontes auxiliares de informação para compensar a falta de dados de CF, como interações usuário-item. Todavia, diferentes interpretações acerca dos problemas mencionados poderiam ser exploradas. O presente trabalho contribui na área de aprendizado de máquina propondo abordagens para lidar com os desafios supracitados. Esta tese é constituída por uma coletânea de trabalhos desenvolvidos pelo autor durante o período de pesquisa, que foram publicados ou submetidos até a atualidade, apresentando: (i) uma revisão sistemática da literatura que analisa e discute abordagens recentes baseadas em aprendizagem profunda para recomendação sob condições de esparsidade, além de identificar desafios e limitações na área de CF; (ii) uma abordagem baseada em Fatoração de Matriz (do inglês, Matrix Factorization, MF ) que explora esparsidade relativa a CF para fusão de classificadores; (iii) um modelo alternativo do classificador não-supervisionado Floresta de Caminhos Ótimos (do inglês, Optimum-Path Forest, OPF ) projetado para operar eficientemente em conjuntos de dados de grande escala, utilizando relação de adjacência baseada em grafo de k-vizinhos-aproximados; e (iv) um modelo OPF para agrupamento de dados baseado no conceito de vizinhança compartilhada para aliviar esparsidade e alta dimensionalidade durante a recomendação baseada em CF. Os resultados experimentais alcançados por meio de tais trabalhos corroboram as hipóteses da presente tese. | por |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | por |
| dc.description.sponsorshipId | CAPES: Código de financiamento 001 | por |
| dc.identifier.citation | MARTINS, Guilherme Brandão. Optimum-path forest in support of collaborative filtering. 2023. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/19885. | * |
| dc.identifier.uri | https://repositorio.ufscar.br/handle/20.500.14289/19885 | |
| dc.language.iso | eng | por |
| dc.publisher | Universidade Federal de São Carlos | por |
| dc.publisher.address | Câmpus São Carlos | por |
| dc.publisher.initials | UFSCar | por |
| dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação - PPGCC | por |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
| dc.subject | Floresta de caminhos ótimos | por |
| dc.subject | Filtragem colaborativa | por |
| dc.subject | Esparsidade | por |
| dc.subject | Optimum-path forest | eng |
| dc.subject | Collaborative filtering | eng |
| dc.subject | Sparsity | eng |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO | por |
| dc.title | Optimum-path forest in support of collaborative filtering | eng |
| dc.title.alternative | Floresta de caminhos ótimos no auxílio a filtragem colaborativa | por |
| dc.type | Tese | por |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- tese-guilhermebrandaomartins.pdf
- Tamanho:
- 6.29 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
- Tese de doutorado - Guilherme Brandão Martins