dc.contributor.author | Ferreira, Gretta Rossi | |
dc.date.accessioned | 2018-04-11T17:20:40Z | |
dc.date.available | 2018-04-11T17:20:40Z | |
dc.date.issued | 2017-09-18 | |
dc.identifier.citation | FERREIRA, Gretta Rossi. Estimação de funções do redshift de galáxias com base em dados fotométricos. 2017. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2017. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9721. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/9721 | |
dc.description.abstract | In a substantial amount of astronomy problems, we are interested in estimating values assumed of some unknown quantity z ∈ R, for many function g, based on covariates x ∈ R^d. This is made using a sample (X1,Z1), ... ,(Xn,Zn). Two approaches that are usually used to solve this problem consist in (1) estimating a regression function of Z in x and plugging it into the g or (2) estimating a conditional density f(z|x) and plugging it into integral of g(z)f(z|x)dz. Unfortunately, few studies exhibit quantitative comparisons between these two approaches. Besides that, few conditional density estimation methods had their performance compared in these problems. In view of this, the objective of this work is to show several comparisons of techniques used to estimate functions of unknown quantity. In particular we highlight nonparametric methods. In addition to estimators (1) and (2), we also propose a new approach that consists in directly estimating the regression function from g (Z) on x . These approaches were tested in different functions in the DEEP2 and Sheldon 2012 datasets. For almost all the functions tested, the estimator (1) obtained the worst results, except when we use the random forests methods. In several cases, the proposed new approach presented better results, as well as the estimator (2). In particular, we verified that random forests methods generally present to good results. | eng |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights.uri | Acesso aberto | por |
dc.subject | Astroestatística | por |
dc.subject | Densidade condicional | por |
dc.subject | Inferência não paramétrica | por |
dc.subject | Regressão | por |
dc.subject | Astrostatistics | eng |
dc.subject | Conditional density | eng |
dc.subject | Nonparametric inference | eng |
dc.subject | Regression | eng |
dc.title | Estimação de funções do redshift de galáxias com base em dados fotométricos | por |
dc.title.alternative | Galaxies redshift function estimation using photometric data | eng |
dc.type | Dissertação | por |
dc.contributor.advisor1 | Izbicki, Rafael | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/9991192137633896 | por |
dc.description.resumo | Em uma quantidade substancial de problemas de astronomia, tem-se interesse na estimação do valor assumido, para diversas funções g, de alguma quantidade desconhecida z ∈ R com base em covariáveis x ∈ R^d. Isto é feito utilizando-se uma amostra (X1,Z1), ... ,(Xn,Zn). As duas abordagens usualmente utilizadas para resolver este problema consistem em (1) estimar a regressão de Z em x, e plugar esta na função g ou (2) estimar a densidade condicional f(z|x) e plugá-la em integral de g(z)f(z|\x)dz. Infelizmente, poucos estudos apresentam comparações quantitativas destas duas abordagens. Além disso, poucos métodos de estimação de densidade condicional tiveram seus desempenhos comparados nestes problemas. Em vista disso, o objetivo deste trabalho é apresentar diversas comparações de técnicas de estimação de funções de uma quantidade desconhecida. Em particular, damos destaque para métodos não paramétricos. Além dos estimadores (1) e (2), propomos também uma nova abordagem que consistem em estimar diretamente a função de regressão de g(Z) em \x. Essas abordagens foram testadas em diferentes funções nos conjuntos de dados DEEP2 e Sheldon 2012. Para quase todas as funções testadas, o estimador (1) obteve os piores resultados, exceto quando utilizamos florestas aleatórias. Em diversos casos, a nova abordagem proposta apresentou melhores resultados, assim como o estimador (2). Em particular, verificamos que métodos via florestas aleatórias, em geral, levaram a bons resultados. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA NAO-PARAMETRICA | por |
dc.ufscar.embargo | 6 meses após a data da defesa | por |
dc.publisher.address | Câmpus São Carlos | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/4529763108510595 | por |