Dimensionality reduction-based metric learning using information theoretic measures

Cervati Neto, Alaor

dc.contributor.author	Cervati Neto, Alaor
dc.date.accessioned	2024-07-18T12:59:54Z
dc.date.available	2024-07-18T12:59:54Z
dc.date.issued	2024-04-30
dc.identifier.citation	CERVATI NETO, Alaor. Dimensionality reduction-based metric learning using information theoretic measures. 2024. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/ufscar/20097.	*
dc.identifier.uri	https://repositorio.ufscar.br/handle/ufscar/20097
dc.description.abstract	Processing large amounts of data to extract useful information is one of the main issues that may be approached using machine learning. One way to obtain this information is by grouping data according to their common features. In very complex data sets, this task may be accomplished by finding simpler ways of representing the relations between this data, lowering their dimensionality. There are many methods to find the data groups in a set automatically. However, finding a way to minimise the complexity of this data without losing relevant content is a computationally costly process. An alternative to that is treating these data sets as probability distributions of random variables and using concepts and measures from information theory to find their relations more efficiently. This work describes some dimensionality reduction methods and information theory measures and proposes that they be joined in order to obtain better results, by creating variants more resistant to disruption in data or differences in set sizes. The adaptation of existing methods to include information theory-based measures is tested on real datasets, and results formally verified as to their adequacy for obtaining more accurate metrics. In most of the tested cases, results show a better performance compared to traditional classification methods, while in others the modifications made those more effective for datasets with fewer samples.	eng
dc.description.sponsorship	Não recebi financiamento	por
dc.language.iso	eng	por
dc.publisher	Universidade Federal de São Carlos	por
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Brazil	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/br/	*
dc.subject	Redução de dimensionalidade	por
dc.subject	Aprendizado de métricas	por
dc.subject	Teoria da informação	por
dc.subject	Dimensionality reduction	eng
dc.subject	Metric learning	eng
dc.subject	Information theory	eng
dc.title	Dimensionality reduction-based metric learning using information theoretic measures	eng
dc.title.alternative	Aprendizado de métricas baseado em redução de dimensionalidade usando medidas da teoria da informação	por
dc.type	Tese	por
dc.contributor.advisor1	Levada, Alexandre Luis Magalhães
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/3341441596395463	por
dc.description.resumo	O processamento de grandes quantidades de dados para extrair informações úteis é um dos principais problemas que podem ser abordados com o aprendizado de máquina. Uma das formas de obter essas informações é agrupando os dados de acordo com as características que tenham em comum. Em conjuntos de dados muito complexos, esta tarefa pode ser realizada encontrando formas mais simples de representar as relações entre esses dados, diminuindo o número de suas dimensões. Há vários métodos para descobrir os agrupamentos de dados em um conjunto de forma automática. Por outro lado, descobrir um meio de minimizar a complexidade desses dados sem perda de conteúdo relevante é um processo computacionalmente custoso. Uma alternativa para isto é o tratamento destes conjuntos de dados como distribuições de probabilidades de variáveis aleatórias e a utilização de conceitos e medidas de teoria de informação para descobrir suas relações de modo mais eficiente. Este trabalho descreve alguns métodos de redução de dimensionalidade e medidas de teoria de informação e propõe que ambos sejam unidos para a obtenção de resultados melhores, criando variantes mais resistentes a perturbações nos dados ou diferenças no tamanho dos conjuntos. A adaptação dos métodos existentes para incluir medidas baseadas em teoria da informação é testada em conjuntos de dados reais, e os resultados verificados formalmente quanto a sua adequação para a obtenção de métricas mais precisas. Na maior parte dos casos estudados, os resultados demonstraram um desempenho superior ao dos métodos tradicionais para classificação, enquanto em outros as alterações realizadas tornaram-nos mais eficazes para conjuntos de dados com um número reduzido de amostras.	por
dc.publisher.initials	UFSCar	por
dc.publisher.program	Programa de Pós-Graduação em Ciência da Computação - PPGCC	por
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO	por
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO	por
dc.publisher.address	Câmpus São Carlos	por
dc.contributor.authorlattes	http://lattes.cnpq.br/6840931161315479	por
dc.contributor.authororcid	https://orcid.org/0000-0001-6212-6205	por
dc.contributor.advisor1orcid	https://orcid.org/0000-0001-8253-2729	por

Ficheros en el ítem

Nombre:: T.pdf
Tamaño:: 1.806Mb
Formato:: PDF

Ver/

Nombre:: license_rdf
Tamaño:: 810bytes
Formato:: application/rdf+xml

Ver/

Este ítem aparece en la(s) siguiente(s) colección(ones)

Teses e dissertações

Mostrar el registro sencillo del ítem

Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivs 3.0 Brazil