Show simple item record

dc.contributor.authorPedote, Gabriel Leonardo
dc.date.accessioned2018-05-09T16:53:59Z
dc.date.available2018-05-09T16:53:59Z
dc.date.issued2018-02-23
dc.identifier.citationPEDOTE, Gabriel Leonardo. Avaliação do impacto da seleção de partições base em ensemble multiobjetivo. 2018. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, Sorocaba, 2018. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9926.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/9926
dc.description.abstractUnsupervised data clustering is not a trivial process, as no previous knowledge is available and real data is often complex and multi-faceted. To make matters worse, traditionally, clustering aims to describe the data being explored under a single perspective. However, it is broadly known that in several cases this approach imposes serious limitations on what could be extracted with the analysis. Furthermore, changes in parameters and preprocessing techniques can dramatically change the final result, either by evidencing or by hiding a possible plural meaning presented in the data. To tackle some of these issues, recent efforts that build knowledge considering multiple partitions as base, such as ensemble clustering, emerged. However, special care must be taken in the composition of those partitions, as their quality and diversity proved to be closely related to their performances. To enhance the quality and diversity of those multiple partitions — and provide better results —, a number of methods to evaluate and select a subset of the partitions have been proposed and successfully applied. In this work, we expand this discussion by evaluating the impact of some of the state-of-the-art selection methods in the novel context of multi-objective cluster ensemble. In this novel context, our analysis show improvements in two important issues: (i) the results are more concise, which facilitates posterior manual analysis, and (ii) are obtained with less computational effort. All of that without affecting the quality of the results.eng
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)por
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rights.uriAcesso abertopor
dc.subjectSeleção de Partiçõespor
dc.subjectEnsemble Multiobjetivopor
dc.subjectDiversidade e Qualidadepor
dc.subjectPartition Selectioneng
dc.subjectMulti-objective Clustering Ensembleeng
dc.subjectDiversity and Qualityeng
dc.subjectTeoria dos conjuntospor
dc.subjectSet theoryeng
dc.subjectPartições (Matemática)por
dc.subjectPartitions (Mathematics)eng
dc.titleAvaliação do impacto da seleção de partições base em ensemble multiobjetivopor
dc.title.alternativeImpact of base partition selection on multi-objective clustering ensembleeng
dc.typeDissertaçãopor
dc.contributor.advisor1Sakata, Tiemi Christine
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3560505262283874por
dc.description.resumoAgrupamento não-supervisionado não é um processo trivial, uma vez que não existe conhecimento prévio e dados reais são tipicamente complexos e multifacetados. Para piorar, algoritmos tradicionais, em grande parte, descrevem os dados em questão sob uma única perspectiva. E ao fazê-lo, impõem sérias limitações no que pode ser extraído com a análise. Para mais, alterações na parametrização e tratativas de pré-processamento podem alterar radicalmente o resultado final, seja evidenciando ou escondendo uma possível pluralidade de significados presente nos dados. Para amenizar alguns desses problemas, técnicas que consideram múltiplas partições surgiram; como, por exemplo, ensemble clustering. Contudo, para utilizá-las deve-se ter em mente a qualidade e a diversidade dessas múltiplas partições, já que ambas características se mostraram fortemente relacionadas a performance dessas técnicas. Uma das formas de favorecer a qualidade e a diversidade dessas múltiplas partições — e tender a melhores resultados — é selecionar e considerar apenas um subconjunto das partições disponíveis, descartando as que não possuem esses dois atributos. Para tal, diversos métodos de seleção de partições foram propostos e aplicados com sucesso na literatura. Nesta dissertação, expandimos essa discussão avaliando o impacto de diferentes métodos de seleção pertencentes ao estado da arte em um contexto inédito, o de ensemble multiobjetivo. Nesse novo contexto, as análises realizadas indicam ganhos em duas importantes frentes — ambas destacadas na literatura do framework aqui tratado: (i) os resultados são mais concisos, o que, na prática, facilita a interpretação manual dos mesmos por especialistas, e (ii) são obtidos com uma fração do esforço computacional, isto é, com maior rapidez e onerando menos recursos. Tudo isso sem implicar perda de qualidade nos resultados finais.por
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCC-Sopor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpor
dc.ufscar.embargoOnlinepor
dc.publisher.addressCâmpus Sorocabapor
dc.contributor.authorlatteshttp://lattes.cnpq.br/6613124555984605por


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record