Utilização de agrupamento como método de pré-processamento em problemas de regressão linear

dc.contributor.advisor1Naldi, Murilo Coelho
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0573662728816861por
dc.contributor.authorMotta, Gabriel Gonçalves
dc.contributor.authorlatteshttp://lattes.cnpq.br/8737313738355971por
dc.date.accessioned2021-11-24T18:55:17Z
dc.date.available2021-11-24T18:55:17Z
dc.date.issued2021-11-19
dc.description.abstractFor real-world data to be explored, pre-processing is needed in order to ease machine learning applications. Nowadays, various pre-processing techniques are available, and this paper aims to show the impacts of using clustering as one of them, more specifically in linear regression problems. Two experiments were carried out, using two different databases: the first one describing data from a series of properties from Ames, a city from Iowa, in the United States of America, and the second one containing information about COVID-19. It was observed that in both cases, clustering before applying the regression model improves regressor performance, based on database nature. Besides the improvement, it is recommended to use clustering alongside other pre-processing techniques.eng
dc.description.resumoPara que dados oriundos de situações do mundo real possam ser explorados em uma análise, é preciso realizar um pré-processamento de modo a facilitar a aplicações de aprendizado de máquina. Muitas técnicas de pré-processamento estão disponíveis hoje em dia, este trabalho tem como objetivo mostrar os impactos de utilizar o agrupamento como uma delas, mas especificamente em problemas de regressão linear. Foram realizados experimentos com duas bases: a primeira descrevendo dados de imóveis de Ames, uma cidade de Iowa nos Estados Unidos e a segunda contendo informações sobre COVID-19. Observou-se que, em ambos os casos, realizar o agrupamento antes do processo de regressão melhora o desempenho do regressor, com a intensidade dessa melhora dependendo da natureza da base. Apesar da melhora estar presente, indica-se usar o agrupamento em conjunto com outras técnicas de pré-processamento.por
dc.description.sponsorshipNão recebi financiamentopor
dc.identifier.citationMOTTA, Gabriel Gonçalves. Utilização de agrupamento como método de pré-processamento em problemas de regressão linear. 2021. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/15156.por
dc.identifier.urihttps://repositorio.ufscar.br/handle/20.500.14289/15156
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.publisher.addressCampus São Carlospor
dc.publisher.courseEngenharia de Computação - ECpor
dc.publisher.initialsUFSCarpor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectData clusteringeng
dc.subjectAgrupamentopor
dc.subjectPré-processamentopor
dc.subjectRegressioneng
dc.subjectRegressãopor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOpor
dc.titleUtilização de agrupamento como método de pré-processamento em problemas de regressão linearpor
dc.title.alternativeUsing clustering as a method of pre-processing in linear regression problemseng
dc.typeTCCpor

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCC Gabriel Motta - Utilização de agrupamento como método de pré-processamento em problemas de regressão linear..pdf
Tamanho:
448.18 KB
Formato:
Adobe Portable Document Format
Descrição:

Coleções