dc.contributor.author | Freitas, Breno Lima de | |
dc.date.accessioned | 2018-01-12T10:36:25Z | |
dc.date.available | 2018-01-12T10:36:25Z | |
dc.date.issued | 2017-12-14 | |
dc.identifier.citation | FREITAS, Breno Lima de. Aprendiz de descritores de mistura gaussiana. 2017. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, Sorocaba, 2017. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9249. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/9249 | |
dc.description.abstract | For the last decades, many Machine Learning methods have been proposed aiming categorizing data. Given many tentative models, those methods try to find the one that fits the dataset by building a hypothesis that predicts unseen samples reasonably well. One of the main concerns in that regard is selecting a model that performs well in unseen samples not overfitting on the known data. In this work, we introduce a classification method based on the minimum description length principle, which naturally offers a tradeoff between model complexity and data fit. The proposed method is multiclass, online and is generic in the regard of data representation. The experiments conducted in real datasets with many different characteristics, have shown that the proposed method is statiscally equivalent to the other classical baseline methods in the literature in the offline scenario and it performed better than some when tested in an online scenario. Moreover, the method has proven to be robust to overfitting and data normalization which poses great features a classifier must have in order to deal with large, complex and real-world classification problems. | eng |
dc.description.sponsorship | Não recebi financiamento | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights.uri | Acesso aberto | por |
dc.subject | Princípio da descrição mais simples | por |
dc.subject | Mistura Gaussiana | por |
dc.subject | Classificação | por |
dc.subject | Aprendizado de máquina | por |
dc.subject | Minimum description length principle | eng |
dc.subject | Gaussan mixture | eng |
dc.subject | Classifiers | eng |
dc.subject | Machine learning | eng |
dc.title | Aprendiz de descritores de mistura gaussiana | por |
dc.title.alternative | Gaussian mixture descriptors learner | eng |
dc.type | Dissertação | por |
dc.contributor.advisor1 | Almeida, Tiago Agostinho de | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/5368680512020633 | por |
dc.description.resumo | Ao longo das últimas décadas, diversos métodos de aprendizado de máquina vêm sendo propostos com o intuito de classificar dados. Entre os modelos candidatos, procura-se selecionar um que se ajuste bem aos dados de treinamento, criando uma hipótese que faça boas predições em amostras não analisadas anteriormente. Um dos maiores desafios é selecionar um modelo, cuja hipótese não seja sobre-ajustada aos dados conhecidos, sendo genérica o suficiente para boas predições futuras. Neste trabalho, é apresentado um método de classificação baseado no princípio da descrição mais simples que efetua uma troca benéfica entre a complexidade do modelo e o ajuste aos dados. O método proposto é multiclasse, incremental e pode ser usado em dados com atributos categóricos, numéricos e contínuos. Experimentos conduzidos em bases reais de diversas características mostraram que o método proposto é estatisticamente equivalente à métodos clássicos na literatura para o cenário offline e superior a alguns métodos no cenário de aprendizado incremental. Além disso, o método mostrou-se robusto ao sobre-ajustamento e à normalização dos dados, apresentando características benéficas para um método de classificação que pode ser aplicado nos dias atuais. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação - PPGCC-So | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | por |
dc.ufscar.embargo | Online | por |
dc.publisher.address | Câmpus Sorocaba | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/9494175519218074 | por |