Modelo hierárquico bayesiano para a previsão de resultados de futebol
| dc.contributor.advisor1 | Salasar, Luis | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/5464564215528609 | |
| dc.contributor.advisor1orcid | https://orcid.org/0000-0003-4715-8633 | |
| dc.contributor.author | Diani, Matheus | |
| dc.contributor.authorlattes | http://lattes.cnpq.br/3465839021153631 | |
| dc.date.accessioned | 2025-07-25T17:16:21Z | |
| dc.date.issued | 2025-07-07 | |
| dc.description.abstract | This study develops and compares two statistical models to predict match outcomes in Brazil’s top tier football league: a Bayesian hierarchical model and an independent Poisson model. Both approaches model goals scored by each team with Poisson distributions parameterized by offensive strength, defensive strength, and a home‑field effect. Model assessment was conducted on two fronts: (i) in‑sample goodness of fit for the full season and (ii) out‑of‑sample predictive performance, using a sequential updating scheme to forecast the second half of the championship. Results reveal a clear trade‑off. The hierarchical model, through shrinkage, produced more stable and consistent forecasts but oversmoothed the extremes, underestimating the performance of the strongest and weakest teams. The independent Poisson model was more sensitive to team differences, achieving better overall fit at the cost of higher predictive variability. Both models exhibited limitations, most notably poor discrimination of draws. A scenario analysis further illustrated how each model captured the evolution of title, top four, and relegation probabilities during the final rounds. Finally, we discuss extensions to enhance predictive accuracy. These include adopting more flexible distributions, such as Negative Binomial to handle overdispersion, and draw‑inflated models, as well as incorporating betting market information either as informative priors, external benchmarks, or to simulate the financial return of betting strategies. Overall, this work advances applied football analytics by detailing practical challenges and outlining promising modeling directions for future research. | eng |
| dc.description.resumo | Este trabalho desenvolve e compara dois modelos estatísticos para prever resultados do Campeonato Brasileiro de futebol, o modelo hierárquico bayesiano e o modelo Poisson Independente. Ambas as abordagens modelam o número de gols marcados por cada equipe utilizando a distribuição de Poisson, com base em parâmetros de força ofensiva, defensiva e um efeito de mando de campo. A avaliação dos modelos foi realizada em duas frentes, incluindo uma análise de qualidade de ajuste aos dados da temporada completa e uma avaliação preditiva fora da amostra, usando um esquema de atualização sequencial para prever a segunda metade do campeonato. Os resultados revelam um trade-off entre as duas abordagens. O modelo hierárquico, por seu efeito de regularização, produziu previsões mais estáveis e consistentes, mas apresentou uma suavização excessiva no ajuste, subestimando o desempenho das equipes nos extremos da tabela. Em contrapartida, o modelo Poisson Independente demonstrou maior sensibilidade às equipes, resultando em melhor ajuste geral, mas com maior variabilidade preditiva. Ambos os modelos, contudo, mostraram limitações, como a dificuldade em prever empates. Adicionalmente, uma análise de cenários demonstrou a capacidade dos modelos em capturar a evolução das probabilidades de título, G4 e rebaixamento ao longo da reta final do campeonato. Por fim, discutem-se extensões para aprimorar as previsões. Sugere-se a exploração de distribuições mais flexíveis, como a Binomial Negativa para tratar a superdispersão, e modelos com inflação de empates. Uma frente de pesquisa promissora envolve a incorporação de informações do mercado de apostas, seja na construção de prioris informativas, como benchmark de desempenho ou na simulação do retorno financeiro de uma estratégia de apostas. Este estudo avança na estatística aplicada ao futebol, ao dissecar os desafios práticos e mapear as possibilidades que novas abordagens de modelagem oferecem para o campo. | |
| dc.description.sponsorship | Não recebi financiamento | |
| dc.identifier.citation | DIANI, Matheus. Modelo hierárquico bayesiano para a previsão de resultados de futebol. 2025. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22430. | por |
| dc.identifier.uri | https://hdl.handle.net/20.500.14289/22430 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de São Carlos | |
| dc.publisher.address | Campus São Carlos | |
| dc.publisher.course | Estatística - Es | |
| dc.publisher.initials | UFSCar | |
| dc.rights | Attribution-NoDerivs 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nd/3.0/br/ | |
| dc.subject | Futebol | |
| dc.subject | Previsão | |
| dc.subject | Inferência bayesiana | |
| dc.subject | Modelo hierárquico | |
| dc.subject | Distribuição de Poisson | |
| dc.subject | Brasileirão | |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICA | |
| dc.title | Modelo hierárquico bayesiano para a previsão de resultados de futebol | |
| dc.title.alternative | A bayesian hierarchical model for football match outcome prediction | eng |
| dc.type | TCC |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Monografia_TCC_Matheus_Diani.pdf
- Tamanho:
- 2.36 MB
- Formato:
- Adobe Portable Document Format