dc.contributor.author | Hisatugu, Matheus Toshio | |
dc.date.accessioned | 2022-10-19T16:49:58Z | |
dc.date.available | 2022-10-19T16:49:58Z | |
dc.date.issued | 2022-09-15 | |
dc.identifier.citation | HISATUGU, Matheus Toshio. Observações atípicas em alta dimensão. 2022. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16903. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/16903 | |
dc.description.abstract | Outliers and heteroskedastic noise are two common situations in Statistics. Nowadays the amount
of generated data is very high and for this reason it is possible to find high dimensional data
(the dimension d is just as large or larger than the number of observations n). Furthermore,
it is possible that the data have heteroskedastic noise, which means that the noise variance
can be different entrywise. Principal component analysis is a technique that aims to create
a subspace with lower dimension than the original space. The technique is used in different
areas such as Statistics, Econometrics, Machine Learning and Applied Mathematics. Choi and
Marron (2019) introduced a new notion of high dimensional outliers that embraces other types
and also investigates the behaviour of these outliers in the subspace created by the principal
components analysis. Most of the techniques used in this context are based on the assumption
of homoskedastic noise. However, as mentioned before, it is known that this is not always the
case. Therefore, Zhang, Cai and Wu (2022) proposed a new method called HeteroPCA, which
main objective is to remove the bias of the main diagonal of the sample covariance matrix due to
heteroskedasticity. In this work, the main objective is to combine the method proposed by Zhang,
Cai and Wu (2022) and the methodology proposed by Choi and Marron (2019) to find a subspace
capable of identifying the presence of outliers when heteroskedasticity noise is present. | eng |
dc.description.sponsorship | Não recebi financiamento | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Observações atípicas em alta dimensão | por |
dc.subject | Análise de componentes principais | por |
dc.subject | Maldição da dimensionalidade | por |
dc.subject | Ruído heteroscedástico | por |
dc.subject | HeteroPCA | por |
dc.subject | High dimensional outliers | eng |
dc.subject | Principal component analysis | eng |
dc.subject | Curse of dimensionality | eng |
dc.subject | Heteroskedastic noise | eng |
dc.title | Observações atípicas em alta dimensão | por |
dc.title.alternative | Outliers in high dimension | eng |
dc.type | Dissertação | por |
dc.contributor.advisor1 | Andrade Filho, Mario de Castro | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/6518161034709249 | por |
dc.description.resumo | Observações atípicas e ruído heteroscedástico são duas situações muito comuns em Estatística.
Atualmente, a quantidade de dados gerada é muito alta e por essa razão é possível encontrar
dados de alta dimensão (número de variáveis, ou dimensão, d tão grande ou maior do que o
número de observações n). Além disso, é possível que os dados possuam ruído heteroscedástico,
isto é, a variância do ruído pode variar de entrada para entrada. A análise de componentes
principais (ACP) é uma técnica muito utilizada que tem como principal objetivo a redução da
dimensionalidade. A técnica é utilizada em diversas áreas como a Estatística, Econometria,
Aprendizado de Máquina e Matemática Aplicada. Choi e Marron (2019) apresentaram uma nova
noção de valores atípicos em alta dimensão que engloba outros tipos e, além disso, investigaram
o comportamento dessas observações atípicas no subespaço criado pela análise de componentes
principais. Grande parte das técnicas utilizadas nesse contexto são utilizadas sob a suposição
de homoscedasticidade, porém, como já mencionado, sabe-se que isso nem sempre acontece.
Sendo assim, Zhang, Cai e Wu (2022) propuseram um novo método chamado HeteroPCA que
tem como objetivo principal remover o viés da diagonal principal da matriz de covariâncias
amostral sob o qual está sujeita devido à heteroscedasticidade. Este trabalho tem como objetivo
combinar o método proposto por Zhang, Cai e Wu (2022) com a metodologia proposta por Choi
e Marron (2019) para encontrar um subespaço capaz de identificar a presença de observações
atípicas quando o ruído heteroscedástico está presente | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS | por |
dc.publisher.address | Câmpus São Carlos | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/0565444239927400 | por |