Mostrar registro simples

dc.contributor.authorAntunes, Vanessa
dc.date.accessioned2018-03-09T15:36:39Z
dc.date.available2018-03-09T15:36:39Z
dc.date.issued2018-01-26
dc.identifier.citationANTUNES, Vanessa. Estratégia híbrida de seleção de partições para o problema de agrupamento de dados. 2018. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, Sorocaba, 2018. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9555.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/9555
dc.description.abstractInability to identify partitions of different sizes and shapes is a fundamental limitation of any clustering algorithm, especially when different regions of the search space contain clusters with varied characteristics. It is possible to apply diverse clustering algorithms, with different parameters, but then, it is necessary to deal with a large number of partitions. Techniques such as ensemble and multiobjective clustering treat this problem using distinct criteria, but they have high computational cost. Moreover, the ensemble technique generates a single solution, which may not represent every real partition present in the data. On the other hand, multiobjective clustering may generate a large number of partitions, which is difficult to analyze manually. In this dissertation, we propose a hybrid multiojective algorithm, HSS (Hybrid Selection Strategy), that aims to return a reduced and yet diverse set of solutions. It can be divided in three steps: (i) the application of a multiobjective algorithm to a set of base partitions for the generation of an approximation of the Pareto Front, (ii) the division of the solutions from the approximation of the Pareto Front into a certain number of regions and (iii) the selection of a solution per region, through the application of the Adjusted Rand Index. Experiments show the effectiveness of HSS in selecting a reduced number of partitions.eng
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)por
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rights.uriAcesso abertopor
dc.subjectAgrupamento multiobjetivopor
dc.subjectPareto-otimalidadepor
dc.subjectSeleção multiobjetivopor
dc.subjectAlgotímospor
dc.subjectAlgorithmseng
dc.subjectCluster analysiseng
dc.subjectAnálise por agrupamentopor
dc.titleEstratégia híbrida de seleção de partições para o problema de agrupamento de dadospor
dc.typeDissertaçãopor
dc.contributor.advisor1Sakata, Tiemi Christine
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3560505262283874por
dc.description.resumoInaptidão para identificar partições de diferentes tamanhos e formas é uma limitação fundamental de qualquer algoritmo de agrupamento, especialmente quando diferentes regiões do espaço de busca contêm clusters com características distintas. A aplicação de diferentes algoritmos de agrupamento, com diferentes parâmetros, é uma possibilidade, porém, neste caso, é necessário lidar com um grande conjunto de partições. Técnicas como ensemble e agrupamento multiobjetivo empregam diferentes abordagens para tratar este problema, porém ambas possuem um custo computacional elevado. Além disso, as técnicas de ensemble geram uma única solução, que pode não representar toda partição real presente no conjunto de dados. O agrupamento multiobjetivo, por outro lado, pode gerar um conjunto grande de partições, inviável de ser analisado manualmente. Nesta dissertação, é proposto um algoritmo multiobjetivo híbrido, HSS (Hybrid Selection Strategy), cujo objetivo é retornar um conjunto reduzido e ao mesmo tempo diverso de partições. Ele pode ser dividido em três passos: (i) aplicação de um algoritmo multiobjetivo em um conjunto base de partições para a geração de uma aproximação da Fronteira de Pareto (FP), (ii) divisão das soluções presentes na aproximação da FP em um certo número de regiões e (iii) seleção de uma partição por região através da aplicação do Adjusted Rand Index (ARI). Experimentos mostram a eficácia do HSS na seleção de um número reduzido de partições.por
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCC-Sopor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOpor
dc.ufscar.embargoOnlinepor
dc.publisher.addressCâmpus Sorocabapor
dc.contributor.authorlatteshttp://lattes.cnpq.br/7744895055289571por


Arquivos deste item

Thumbnail
Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples