Avaliação de métodos de construção de redes e detecção de comunidades no agrupamento de textos

Dal Bello, Paulo Henrique

dc.contributor.author	Dal Bello, Paulo Henrique
dc.date.accessioned	2022-09-26T19:43:08Z
dc.date.available	2022-09-26T19:43:08Z
dc.date.issued	2022-09-20
dc.identifier.citation	DAL BELLO, Paulo Henrique. Avaliação de métodos de construção de redes e detecção de comunidades no agrupamento de textos. 2022. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16675.	*
dc.identifier.uri	https://repositorio.ufscar.br/handle/ufscar/16675
dc.description.abstract	Due to the large amount of data produced daily in text format, whether publicly on social networks or privately within companies, there is a need to analyze and extract information from them. The goal is to turn them into useful tools, such as translation systems and virtual assistants. The area of Natural Language Processing, in conjunction with Machine Learning, provides the necessary technologies for such an objective. One of the most explored tasks in this context is the clustering of documents through unsupervised classification. Document clusters can provide a description of the subjects covered by a collection of documents, representing, in general, categories or themes. Considering this task, in addition to the traditional clustering algorithms, such as k-Means, approaches based on networks have been gaining notoriety in the literature, which build a network from the document collection and use community detection to find groups of documents representing similar themes. These approaches initially need the construction of a network from the documents analyzed, and several algorithms can be used for this purpose, which produces networks with distinct topological characteristics, directly interfering with the quality of the cluster. In this context, the aim of this study is to analyze the influence of network construction algorithms in the clustering of texts. It seeks to assess whether the different ways of building networks can influence the generation of community structures that are representative considering the classes of text documents.	eng
dc.description.sponsorship	Não recebi financiamento	por
dc.language.iso	por	por
dc.publisher	Universidade Federal de São Carlos	por
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Brazil	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/br/	*
dc.subject	Aprendizado de máquina	por
dc.subject	Aprendizado não supervisionado	por
dc.subject	Agrupamento	por
dc.subject	Detecção de comunidades	por
dc.subject	Redes	por
dc.title	Avaliação de métodos de construção de redes e detecção de comunidades no agrupamento de textos	por
dc.title.alternative	A comparative study on network construction and community detection in document clustering	eng
dc.type	TCC	por
dc.contributor.advisor1	Valejo, Alan Demétrius Baria
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/9546164790189830	por
dc.description.resumo	Devido à grande quantidade de dados produzidos diariamente no formato de texto, seja publicamente em redes sociais ou de forma privada dentro de empresas, há a necessidade de analisá-los e extrair deles informação. O objetivo é transformá-los em ferramentas úteis, como sistemas de tradução e assistentes virtuais. A área de Processamento de Linguagem Natural, em conjunto com o Aprendizado de Máquina, fornece as tecnologias necessárias para tal objetivo. Uma tarefa muito explorada nesse contexto é o agrupamento de documentos por meio de classificação não supervisionada. Grupos de documentos podem fornecer uma descrição dos assuntos abordados por uma coleção de documentos, representando, em geral, categorias ou temas. Considerando essa tarefa, além dos algoritmos tradicionais de agrupamento, como o k-Means, as abordagens baseadas em redes vem ganhando notoriedade na literatura, as quais constroem uma rede a partir da coleção de documento e utilizam detecção de comunidades para encontrar grupos de documentos que representem temas similares. Essas abordagens necessitam, inicialmente, da construção de uma rede a partir dos documentos analisados, sendo que diversos algoritmos podem ser utilizados para esse propósito, os quais produzem redes com características topológicas distintas, interferindo diretamente na qualidade do agrupamento. Nesse contexto, o objetivo deste estudo é analisar a influência dos algoritmos de construção de redes no agrupamento de textos. Busca-se avaliar se as diferentes formas de se construir redes podem influenciar na geração de estruturas de comunidades que sejam representativas considerando as classes dos documentos de textos.	por
dc.publisher.initials	UFSCar	por
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO	por
dc.publisher.address	Câmpus São Carlos	por
dc.contributor.authorlattes	http://lattes.cnpq.br/3918266533231668	por
dc.publisher.course	Engenharia de Computação - EC	por

Arquivos deste item

Nome:: 2021_1_TCC_Paulo_Dal_Bello_fin ...
Tamanho:: 1.061Mb
Formato:: PDF
Descrição:: TCC Paulo Henrique Dal Bello

Visualizar/Abrir

Nome:: license_rdf
Tamanho:: 811bytes
Formato:: application/rdf+xml

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Exceto quando indicado o contrário, a licença deste item é descrito como Attribution-NonCommercial-NoDerivs 3.0 Brazil