Mostrar el registro sencillo del ítem

dc.contributor.authorCalixto, Ariel Semensato
dc.date.accessioned2023-04-05T18:48:31Z
dc.date.available2023-04-05T18:48:31Z
dc.date.issued2023-03-29
dc.identifier.citationCALIXTO, Ariel Semensato. Análise e aplicações do algoritmo UMAP para classificação e redução de dimensionalidade de conjuntos de dados com múltiplas variáveis. 2023. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/17623.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/17623
dc.description.abstractThrough many real-life applications, gathering information through real instruments subject to noise and imperfections tends to generate datasets where the number of observed variables and components easily exceeds a number of dimensions where manipulation, clustering and classification of said data into distinct sets based on their similarities becomes either difficult or computationally expensive. An efficient way to preemptively prepare this data for further processing and meaningful representation is dimensionality reduction, a process that transforms a dataset from a high-dimensional space to a low-dimensional space such as the low-dimensional space still retains relevant properties from the original dataset. This work proposes to evaluate the current state-of-the-art and establish, using performance criteria, comparisons between the frequently used dimensionality reduction used today and historically, with the main focus on UMAP, a method that seeks to prioritize the classification of data locally close by means of their characteristics. Results were obtained using different datasets with different properties, in order to obtain relevant metrics on the impact that each characteristic of these datasets has on the final results.eng
dc.description.sponsorshipNão recebi financiamentopor
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsCC0 1.0 Universal*
dc.rights.urihttp://creativecommons.org/publicdomain/zero/1.0/*
dc.subjectRedução de dimensionalidadepor
dc.subjectClassificação de conjuntospor
dc.subjectAprendizado de máquinapor
dc.subjectPCApor
dc.subjectt-SNEpor
dc.subjectUMAPpor
dc.titleAnálise e aplicações do algoritmo UMAP para classificação e redução de dimensionalidade de conjuntos de dados com múltiplas variáveispor
dc.title.alternativeAnalysis and applications of the UMAP algorithm for classification and dimensionality reduction of datasets with multiple variableseng
dc.typeTCCpor
dc.contributor.advisor1Levada, Alexandre Luis Magalhães
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3341441596395463por
dc.description.resumoEm muitas aplicações reais, o levantamento de informações por meio de instrumentos reais, sujeitos à ruídos e imperfeições tende a gerar conjuntos de dados onde o número de variáveis e componentes observados facilmente excede um número de dimensões onde a manipulação, o agrupamento e a classificação desses dados em conjuntos distintos baseados em suas similaridades se tornam não intuitivos ou extremamente custosos computacionalmente. Uma forma eficiente de preparar esses dados de maneira preemptiva para futuros processamentos e representações significativas é a redução de dimensionalidade, um processo que transforma um conjunto de dados de um espaço de muitas dimensões para um espaço de poucas dimensões de forma que o espaço de poucas dimensões ainda possui propriedades relevantes do conjunto. Este trabalho propõe avaliar o atual estado da arte e estabelecer, utilizando critérios de desempenho, comparações entre os algoritmos de redução de dimensionalidade frequentemente utilizados atualmente e em um contexto histórico, com o foco principal no UMAP, um método que procura priorizar a classificação de conjuntos de dados localmente próximos por meio de suas características. Resultados foram obtidos utilizando diversos conjuntos de dados com propriedades diferentes, de forma a obter métricas relevantes sobre as influências que cada característica desses conjuntos possui nos resultados finais.por
dc.publisher.initialsUFSCarpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOpor
dc.publisher.addressCâmpus São Carlospor
dc.publisher.courseEngenharia de Computação - ECpor


Ficheros en el ítem

Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

CC0 1.0 Universal
Excepto si se señala otra cosa, la licencia del ítem se describe como CC0 1.0 Universal