dc.contributor.author | Coelho, Fabiano Rodrigues | |
dc.date.accessioned | 2018-02-15T16:41:02Z | |
dc.date.available | 2018-02-15T16:41:02Z | |
dc.date.issued | 2017-08-11 | |
dc.identifier.citation | COELHO, Fabiano Rodrigues. Seleção de modelos multiníveis para dados de avaliação educacional. 2017. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2017. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9429. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/9429 | |
dc.description.abstract | When a dataset contains a hierarchical data structure, a possible approach is the multilevel
regression modelling, which is justified by the significative amout of the data variability that can
be explained by macro level processes. In this work, a selection of multilevel regression models
for educational data is developed. This analysis is divided into two parts: variable selection and
model selection. The latter is subdivided into two categories: classical and Bayesian modeling.
Traditional criteria for model selection such as Lasso, AIC, BIC, and WAIC, among others
are used in this study as an attempt to identify the factors influencing ninth grade students’
performance in Mathematics of elementary education in the State of São Paulo. Likewise, an
investigation was conducted to evaluate the performance of each variable selection criteria and
model selection methods applied to fitted models that will be mentioned throughout this work. It
was possible to conclude that, under the frequentist approach, BIC is the most efficient, whereas
under the bayesian approach, WAIC presented better results. Using Lasso under the frequentist
approach, a decrease of 34% on the number of predictors was observed. Finally, we identified
that the performance in Mathematics of students in the ninth year of elementary school in the
state of São Paulo is most influenced by the following covariates: mother’s educational level,
frequency of book reading, time spent with recreation in classroom, the fact of liking Math,
school global performance in Mathematics, performance in Portuguese, school administrative
dependence, gender, father’s educational degree, failures and age-grade distortion. | eng |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights.uri | Acesso aberto | por |
dc.subject | Modelos multiníveis | por |
dc.subject | Seleção de modelos | por |
dc.subject | Critério de informação | por |
dc.subject | Prova Brasil | por |
dc.subject | Multilevel models | eng |
dc.subject | Model selection | eng |
dc.subject | Information criterion | eng |
dc.subject | Brazil exam - basic education assessment | eng |
dc.title | Seleção de modelos multiníveis para dados de avaliação educacional | por |
dc.title.alternative | Selection of multilevel models for educational evaluation data | eng |
dc.type | Dissertação | por |
dc.contributor.advisor1 | Noveli, Cibele Maria Russo | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/1011098065426388 | por |
dc.description.resumo | Quando um conjunto de dados possui uma estrutura hierárquica, uma possível abordagem são os
modelos de regressão multiníveis, que se justifica pelo fato de haver uma porção significativa da
variabilidade dos dados que pode ser explicada por níveis macro. Neste trabalho, desenvolvemos
a seleção de modelos de regressão multinível aplicados a dados educacionais. Esta análise
divide-se em duas partes: seleção de variáveis e seleção de modelos. Esta última subdivide-se
em dois casos: modelagem clássica e modelagem bayesiana. Buscamos através de critérios
como o Lasso, AIC, BIC, WAIC entre outros, encontrar quais são os fatores que influenciam no
desempenho em matemática dos alunos do nono ano do ensino fundamental do estado de São
Paulo. Também investigamos o funcionamento de cada um dos critérios de seleção de variáveis
e de modelos. Foi possível concluir que, sob a abordagem frequentista, o critério de seleção de
modelos BIC é o mais eficiente, já na abordagem bayesiana, o critérioWAIC apresentou melhores
resultados. Utilizando o critério de seleção de variáveis Lasso para abordagem clássica, houve
uma diminuição de 34% dos preditores do modelo. Por fim, identificamos que o desempenho
em matemática dos estudantes do nono ano do ensino fundamental do estado de São Paulo é
influenciado pelas seguintes covariáveis: grau de instrução da mãe, frequência de leitura de
livros, tempo gasto com recreação em dia de aula, o fato de gostar de matemática, o desempenho
em matemática global da escola, desempenho em língua portuguesa do aluno, dependência
administrativa da escola, sexo, grau de instrução do pai, reprovações e distorção idade-série. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa de Pós-graduação em Estatística - Interinstitucional (PIPGEs) | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA | por |
dc.ufscar.embargo | Online | por |
dc.publisher.address | Câmpus São Carlos | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/1142248575230930 | por |