dc.contributor.author | Tapia, Cristel Ecaterin Vera | |
dc.date.accessioned | 2023-03-01T13:18:06Z | |
dc.date.available | 2023-03-01T13:18:06Z | |
dc.date.issued | 2022-12-14 | |
dc.identifier.citation | TAPIA, Cristel Ecaterin Vera. Estimação do número de comunidades no modelo estocástico de blocos com correção de grau. 2022. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/17431. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/17431 | |
dc.description.abstract | The stochastic block model (SBM) is a random graph model that splits the set of vertices into blocks, and
the probability connection between each pair of vertices depends on the blocks to which the vertices
belong. The SBM was introduced by Holland et al. (1983) and it is traditionally applied to simple graphs,
with each entry in the adjacency matrix following the Bernoulli distribution. Karrer and Newman (2011)
extended the model in two directions: they defined the multigraph model (Poisson SBM), in which the
entries of the adjacency matrix follow the Poisson distribution, and introduced the degree corrected
stochastic block model (DCSBM) that allows the degree distribution of vertices also depend on the
vertices, and not just on the blocks they belong to.
This thesis is devoted to the problem of estimating the number of communities in the Poisson SBM and
DCSBM. We consider the dense regime, in which the probability of connection between pairs of vertices
does not depend on the size of the graph, or even the semi-sparse regime, in which the probability of
connection between pairs of vertices can decay to 0 (at a certain rate) with the size of the graph. In this
general context, we prove that the estimator of the number of communities introduced by Cerqueira and
Leonardi (2020) (with the necessary changes) is still strongly consistent. | eng |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Modelo estocástico de blocos de Poisson | por |
dc.subject | Modelo estocástico de blocos com correção de grau | por |
dc.subject | Estimação do número de comunidades | por |
dc.subject | regime semi-esparso | por |
dc.subject | Poisson stochastic block model | eng |
dc.subject | Degree corrected stochastic block model | eng |
dc.subject | Estimation of the number of communities | eng |
dc.subject | semi-sparse regime | eng |
dc.title | Estimação do número de comunidades no modelo estocástico de blocos com correção de grau | por |
dc.title.alternative | Estimation of the number of communities in the degree corrected stochastic block model | eng |
dc.type | Tese | por |
dc.contributor.advisor1 | Gallo, Alexsandro Giacomo Grimbert | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/4037274656833325 | por |
dc.contributor.advisor-co1 | Leonardi, Florencia Graciela | |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/7805423923220410 | por |
dc.description.resumo | O modelo estocástico de blocos (SBM, do inglês Stochastic Block Model) é um modelo de grafos
aleatórios em que o conjunto de vértices é dividido em blocos, e a probabilidade de conexão entre cada
par de vértices depende dos blocos aos quais os vértices pertencem. O SBM foi introduzido por Holland
et al. (1983), é tipicamente aplicado em grafos simples, com cada entrada da matriz de adjacência
seguindo uma distribuição de Bernoulli. Karrer e Newman (2011) estenderam o modelo em duas
direções: definiram o modelo multigrafo ou também conhecido como modelo estocástico de blocos de
Poisson (Poisson SBM), em que as entradas da matriz de adjacência seguem a distribuição de Poisson,
e introduziram o modelo estocástico de blocos com correção de grau (DCSBM, do inglês Degree
Corrected Stochastic Block Model), que permite que a distribuição dos graus dos vértices dependa
também dos vértices, e não somente dos blocos aos quais pertencem.
A presente tese é dedicada ao problema de estimação do número de comunidades no Poisson SBM e
no DCSBM. Consideramos o regime denso, no qual a probabilidade de conexão entre pares de vértices
não depende do tamanho do grafo e também o regime semi-esparso, no qual a probabilidade de conexão
entre pares de vértices pode decair para 0 (numa certa taxa) com o tamanho do grafo. Neste contexto
geral, provamos que o estimador do número de comunidades introduzido por Cerqueira e Leonardi
(2020) (com as devidas alterações) é fortemente consistente. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE | por |
dc.description.sponsorshipId | 001 | por |
dc.publisher.address | Câmpus São Carlos | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/7995991837839001 | por |