dc.contributor.author | Pedote, Gabriel Leonardo | |
dc.date.accessioned | 2018-05-09T16:53:59Z | |
dc.date.available | 2018-05-09T16:53:59Z | |
dc.date.issued | 2018-02-23 | |
dc.identifier.citation | PEDOTE, Gabriel Leonardo. Avaliação do impacto da seleção de partições base em ensemble multiobjetivo. 2018. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, Sorocaba, 2018. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9926. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/9926 | |
dc.description.abstract | Unsupervised data clustering is not a trivial process, as no previous knowledge is available
and real data is often complex and multi-faceted. To make matters worse, traditionally,
clustering aims to describe the data being explored under a single perspective. However, it
is broadly known that in several cases this approach imposes serious limitations on what
could be extracted with the analysis. Furthermore, changes in parameters and preprocessing
techniques can dramatically change the final result, either by evidencing or by hiding a
possible plural meaning presented in the data. To tackle some of these issues, recent efforts
that build knowledge considering multiple partitions as base, such as ensemble clustering,
emerged. However, special care must be taken in the composition of those partitions, as
their quality and diversity proved to be closely related to their performances. To enhance
the quality and diversity of those multiple partitions — and provide better results —, a
number of methods to evaluate and select a subset of the partitions have been proposed
and successfully applied. In this work, we expand this discussion by evaluating the impact
of some of the state-of-the-art selection methods in the novel context of multi-objective
cluster ensemble. In this novel context, our analysis show improvements in two important
issues: (i) the results are more concise, which facilitates posterior manual analysis, and
(ii) are obtained with less computational effort. All of that without affecting the quality
of the results. | eng |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights.uri | Acesso aberto | por |
dc.subject | Seleção de Partições | por |
dc.subject | Ensemble Multiobjetivo | por |
dc.subject | Diversidade e Qualidade | por |
dc.subject | Partition Selection | eng |
dc.subject | Multi-objective Clustering Ensemble | eng |
dc.subject | Diversity and Quality | eng |
dc.subject | Teoria dos conjuntos | por |
dc.subject | Set theory | eng |
dc.subject | Partições (Matemática) | por |
dc.subject | Partitions (Mathematics) | eng |
dc.title | Avaliação do impacto da seleção de partições base em ensemble multiobjetivo | por |
dc.title.alternative | Impact of base partition selection on multi-objective clustering ensemble | eng |
dc.type | Dissertação | por |
dc.contributor.advisor1 | Sakata, Tiemi Christine | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/3560505262283874 | por |
dc.description.resumo | Agrupamento não-supervisionado não é um processo trivial, uma vez que não existe
conhecimento prévio e dados reais são tipicamente complexos e multifacetados. Para
piorar, algoritmos tradicionais, em grande parte, descrevem os dados em questão sob uma
única perspectiva. E ao fazê-lo, impõem sérias limitações no que pode ser extraído com a
análise. Para mais, alterações na parametrização e tratativas de pré-processamento podem
alterar radicalmente o resultado final, seja evidenciando ou escondendo uma possível
pluralidade de significados presente nos dados. Para amenizar alguns desses problemas,
técnicas que consideram múltiplas partições surgiram; como, por exemplo, ensemble
clustering. Contudo, para utilizá-las deve-se ter em mente a qualidade e a diversidade dessas
múltiplas partições, já que ambas características se mostraram fortemente relacionadas a
performance dessas técnicas. Uma das formas de favorecer a qualidade e a diversidade dessas
múltiplas partições — e tender a melhores resultados — é selecionar e considerar apenas
um subconjunto das partições disponíveis, descartando as que não possuem esses dois
atributos. Para tal, diversos métodos de seleção de partições foram propostos e aplicados
com sucesso na literatura. Nesta dissertação, expandimos essa discussão avaliando o impacto
de diferentes métodos de seleção pertencentes ao estado da arte em um contexto inédito, o
de ensemble multiobjetivo. Nesse novo contexto, as análises realizadas indicam ganhos em
duas importantes frentes — ambas destacadas na literatura do framework aqui tratado:
(i) os resultados são mais concisos, o que, na prática, facilita a interpretação manual dos
mesmos por especialistas, e (ii) são obtidos com uma fração do esforço computacional,
isto é, com maior rapidez e onerando menos recursos. Tudo isso sem implicar perda de
qualidade nos resultados finais. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação - PPGCC-So | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | por |
dc.ufscar.embargo | Online | por |
dc.publisher.address | Câmpus Sorocaba | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/6613124555984605 | por |