Modelo hierárquico bayesiano para a previsão de resultados de futebol

dc.contributor.advisor1Salasar, Luis
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/5464564215528609
dc.contributor.advisor1orcidhttps://orcid.org/0000-0003-4715-8633
dc.contributor.authorDiani, Matheus
dc.contributor.authorlatteshttp://lattes.cnpq.br/3465839021153631
dc.date.accessioned2025-07-25T17:16:21Z
dc.date.issued2025-07-07
dc.description.abstractThis study develops and compares two statistical models to predict match outcomes in Brazil’s top tier football league: a Bayesian hierarchical model and an independent Poisson model. Both approaches model goals scored by each team with Poisson distributions parameterized by offensive strength, defensive strength, and a home‑field effect. Model assessment was conducted on two fronts: (i) in‑sample goodness of fit for the full season and (ii) out‑of‑sample predictive performance, using a sequential updating scheme to forecast the second half of the championship. Results reveal a clear trade‑off. The hierarchical model, through shrinkage, produced more stable and consistent forecasts but oversmoothed the extremes, underestimating the performance of the strongest and weakest teams. The independent Poisson model was more sensitive to team differences, achieving better overall fit at the cost of higher predictive variability. Both models exhibited limitations, most notably poor discrimination of draws. A scenario analysis further illustrated how each model captured the evolution of title, top four, and relegation probabilities during the final rounds. Finally, we discuss extensions to enhance predictive accuracy. These include adopting more flexible distributions, such as Negative Binomial to handle overdispersion, and draw‑inflated models, as well as incorporating betting market information either as informative priors, external benchmarks, or to simulate the financial return of betting strategies. Overall, this work advances applied football analytics by detailing practical challenges and outlining promising modeling directions for future research.eng
dc.description.resumoEste trabalho desenvolve e compara dois modelos estatísticos para prever resultados do Campeonato Brasileiro de futebol, o modelo hierárquico bayesiano e o modelo Poisson Independente. Ambas as abordagens modelam o número de gols marcados por cada equipe utilizando a distribuição de Poisson, com base em parâmetros de força ofensiva, defensiva e um efeito de mando de campo. A avaliação dos modelos foi realizada em duas frentes, incluindo uma análise de qualidade de ajuste aos dados da temporada completa e uma avaliação preditiva fora da amostra, usando um esquema de atualização sequencial para prever a segunda metade do campeonato. Os resultados revelam um trade-off entre as duas abordagens. O modelo hierárquico, por seu efeito de regularização, produziu previsões mais estáveis e consistentes, mas apresentou uma suavização excessiva no ajuste, subestimando o desempenho das equipes nos extremos da tabela. Em contrapartida, o modelo Poisson Independente demonstrou maior sensibilidade às equipes, resultando em melhor ajuste geral, mas com maior variabilidade preditiva. Ambos os modelos, contudo, mostraram limitações, como a dificuldade em prever empates. Adicionalmente, uma análise de cenários demonstrou a capacidade dos modelos em capturar a evolução das probabilidades de título, G4 e rebaixamento ao longo da reta final do campeonato. Por fim, discutem-se extensões para aprimorar as previsões. Sugere-se a exploração de distribuições mais flexíveis, como a Binomial Negativa para tratar a superdispersão, e modelos com inflação de empates. Uma frente de pesquisa promissora envolve a incorporação de informações do mercado de apostas, seja na construção de prioris informativas, como benchmark de desempenho ou na simulação do retorno financeiro de uma estratégia de apostas. Este estudo avança na estatística aplicada ao futebol, ao dissecar os desafios práticos e mapear as possibilidades que novas abordagens de modelagem oferecem para o campo.
dc.description.sponsorshipNão recebi financiamento
dc.identifier.citationDIANI, Matheus. Modelo hierárquico bayesiano para a previsão de resultados de futebol. 2025. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22430.por
dc.identifier.urihttps://hdl.handle.net/20.500.14289/22430
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCampus São Carlos
dc.publisher.courseEstatística - Es
dc.publisher.initialsUFSCar
dc.rightsAttribution-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nd/3.0/br/
dc.subjectFutebol
dc.subjectPrevisão
dc.subjectInferência bayesiana
dc.subjectModelo hierárquico
dc.subjectDistribuição de Poisson
dc.subjectBrasileirão
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICA
dc.titleModelo hierárquico bayesiano para a previsão de resultados de futebol
dc.title.alternativeA bayesian hierarchical model for football match outcome predictioneng
dc.typeTCC

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Monografia_TCC_Matheus_Diani.pdf
Tamanho:
2.36 MB
Formato:
Adobe Portable Document Format

Coleções