Show simple item record

dc.contributor.authorCarvalho, Danilo Codeco
dc.date.accessioned2016-11-08T18:42:49Z
dc.date.available2016-11-08T18:42:49Z
dc.date.issued2016-06-06
dc.identifier.citationCARVALHO, Danilo Codeco. Obtenção de padrões sequenciais em data streams atendendo requisitos do Big Data. 2016. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/ufscar/8280.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/8280
dc.description.abstractThe growing amount of data produced daily, by both businesses and individuals in the web, increased the demand for analysis and extraction of knowledge of this data. While the last two decades the solution was to store and perform data mining algorithms, currently it has become unviable even to supercomputers. In addition, the requirements of the Big Data age go far beyond the large amount of data to analyze. Response time requirements and complexity of the data acquire more weight in many areas in the real world. New models have been researched and developed, often proposing distributed computing or different ways to handle the data stream mining. Current researches shows that an alternative in the data stream mining is to join a real-time event handling mechanism with a classic mining association rules or sequential patterns algorithms. In this work is shown a data stream mining approach to meet the Big Data response time requirement, linking the event handling mechanism in real time Esper and Incremental Miner of Stretchy Time Sequences (IncMSTS) algorithm. The results show that is possible to take a static data mining algorithm for data stream environment and keep tendency in the patterns, although not possible to continuously read all data coming into the data stream.eng
dc.description.sponsorshipConselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)por
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rights.uriAcesso abertopor
dc.subjectMineração de dadospor
dc.subjectMineração no Big Datapor
dc.subjectMineração de data streamspor
dc.subjectMineração em fluxos de dadospor
dc.subjectProcessamento de eventos complexospor
dc.subjectData miningeng
dc.subjectMining Big Dataeng
dc.subjectData stream miningeng
dc.subjectComplex event processingeng
dc.subjectSliding windoweng
dc.subjectSequential pattern miningeng
dc.subjectAssociation rule miningeng
dc.titleObtenção de padrões sequenciais em data streams atendendo requisitos do Big Datapor
dc.typeDissertaçãopor
dc.contributor.advisor1Santos, Marilde Terezinha Prado
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/9826026025118073por
dc.description.resumoO crescimento da quantidade de dados produzidos diariamente, tanto por empresas como por indivíduos na web, aumentou a exigência para a análise e extração de conhecimento sobre esses dados. Enquanto nas duas últimas décadas a solução era armazenar e executar algoritmos de mineração de dados, atualmente isso se tornou inviável mesmo em super computadores. Além disso, os requisitos da chamada era do Big Data vão muito além da grande quantidade de dados a se analisar. Requisitos de tempo de resposta e complexidade dos dados adquirem maior peso em muitos domínios no mundo real. Novos modelos têm sido pesquisados e desenvolvidos, muitas vezes propondo computação distribuída ou diferentes formas de se tratar a mineração de fluxo de dados. Pesquisas atuais mostram que uma alternativa na mineração de fluxo de dados é unir um mecanismo de tratamento de eventos em tempo real com algoritmos clássicos de mineração de regras de associação ou padrões sequenciais. Neste trabalho é mostrada uma abordagem de mineração de fluxo de dados (data stream) para atender ao requisito de tempo de resposta do Big Data, que une o mecanismo de manipulação de eventos em tempo real Esper e o algoritmo Incremental Miner of Stretchy Time Sequences (IncMSTS). Os resultados mostram ser possível levar um algoritmo de mineração de dados estático para o ambiente de fluxo de dados e manter as tendências de padrões encontrados, mesmo não sendo possível ler todos os dados vindos continuamente no fluxo de dados.por
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCCpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRApor
dc.ufscar.embargoOnlinepor
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/2824991715613370por


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record