dc.contributor.author | Motta, Gabriel Gonçalves | |
dc.date.accessioned | 2021-11-24T18:55:17Z | |
dc.date.available | 2021-11-24T18:55:17Z | |
dc.date.issued | 2021-11-19 | |
dc.identifier.citation | MOTTA, Gabriel Gonçalves. Utilização de agrupamento como método de pré-processamento em problemas de regressão linear. 2021. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/15156. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/15156 | |
dc.description.abstract | For real-world data to be explored, pre-processing is needed in order to ease machine
learning applications. Nowadays, various pre-processing techniques are available, and this paper
aims to show the impacts of using clustering as one of them, more specifically in linear
regression problems. Two experiments were carried out, using two different databases: the
first one describing data from a series of properties from Ames, a city from Iowa, in the
United States of America, and the second one containing information about COVID-19. It was
observed that in both cases, clustering before applying the regression model improves
regressor performance, based on database nature. Besides the improvement, it is
recommended to use clustering alongside other pre-processing techniques. | eng |
dc.description.sponsorship | Não recebi financiamento | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Data clustering | eng |
dc.subject | Agrupamento | por |
dc.subject | Pré-processamento | por |
dc.subject | Regression | eng |
dc.subject | Regressão | por |
dc.title | Utilização de agrupamento como método de pré-processamento em problemas de regressão linear | por |
dc.title.alternative | Using clustering as a method of pre-processing in linear regression problems | eng |
dc.type | TCC | por |
dc.contributor.advisor1 | Naldi, Murilo Coelho | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/0573662728816861 | por |
dc.description.resumo | Para que dados oriundos de situações do mundo real possam ser explorados em uma
análise, é preciso realizar um pré-processamento de modo a facilitar a aplicações de
aprendizado de máquina. Muitas técnicas de pré-processamento estão disponíveis hoje em
dia, este trabalho tem como objetivo mostrar os impactos de utilizar o agrupamento como
uma delas, mas especificamente em problemas de regressão linear. Foram realizados
experimentos com duas bases: a primeira descrevendo dados de imóveis de Ames, uma
cidade de Iowa nos Estados Unidos e a segunda contendo informações sobre COVID-19.
Observou-se que, em ambos os casos, realizar o agrupamento antes do processo de
regressão melhora o desempenho do regressor, com a intensidade dessa melhora
dependendo da natureza da base. Apesar da melhora estar presente, indica-se usar o
agrupamento em conjunto com outras técnicas de pré-processamento. | por |
dc.publisher.initials | UFSCar | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO | por |
dc.publisher.address | Câmpus São Carlos | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/8737313738355971 | por |
dc.publisher.course | Engenharia de Computação - EC | por |