Mostrar el registro sencillo del ítem

dc.contributor.authorCristiani, André Luis
dc.date.accessioned2024-07-16T16:17:10Z
dc.date.available2024-07-16T16:17:10Z
dc.date.issued2022-02-11
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/20010
dc.description.abstractLearning in data streams (DS) is a research area that seeks to extract knowledge from a large amount of continuously generated data in a short period of time. The novelty detection (ND) is responsible for identifying the emergence of new concepts and changes in known concepts. The true labels of the instances can be used so that the algorithms adapt to the concept evolution and concept drift. The time between the classification of an instance and the arrival of its true label is called latency. Most applications consider that these true labels will never be available. Others are more optimistic and assume that the true label will be available shortly after the instance has been classified. Another way is to consider that, after a certain time, the true labels will be available, which is applicable in most real-world scenarios. The use of concepts from fuzzy set theory makes it possible to make learning adaptable to possible inaccuracies in the data. However, few approaches use the concepts of fuzzy set theory and consider intermediate latency to obtain the labels. Therefore, this work proposes a method for classifying multiclass ND in DS for intermediate and extreme latency scenarios based on ECSMiner and PFuzzND algorithms. The results obtained show that the proposed algorithm obtained good accuracy in the classification and detection of multiclass novelties, classifying outliers that approaches that use crisp clustering were not able to classify. In addition, improvements were presented in relation to the algorithm initialization parameters, which reduce the complexity of its use, maintaining good results.eng
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)por
dc.language.isoengpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectFluxo contínuo de dadospor
dc.subjectDetecção de novidadespor
dc.subjectLatência intermediáriapor
dc.subjectTeoria dos conjuntos fuzzypor
dc.subjectData streamseng
dc.subjectNovelty detectioneng
dc.subjectIntermediate latencyeng
dc.subjectFuzzy set theoryeng
dc.titleFuzzy approach for classification and novelty detection in data streamseng
dc.title.alternativeAbordagem fuzzy para classificação e detecção de novidades em fluxo de dadospor
dc.typeDissertaçãopor
dc.contributor.advisor1Camargo, Heloisa de Arruda
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0487231065057783por
dc.description.resumoAprendizado em fluxo contínuo de dados (FCD) é uma área de pesquisa que busca extrair conhecimentos de uma grande quantidade de dados gerados de maneira contínua em um curto espaço de tempo. A detecção de novidades (DN) é responsável por identificar o surgimento de novos conceitos e alterações em conceitos conhecidos. Os rótulos verdadeiros das instâncias podem ser utilizados para que os algoritmos se adaptem à evolução e mudança de conceito. O tempo entre a classificação de uma instância e a chegada de seu rótulo verdadeiro é denominado latência. Grande parte das aplicações consideram que esses rótulos verdadeiros nunca estarão disponíveis. Outras são mais otimistas e consideram que o rótulo verdadeiro estará disponível logo após a classificação da instância. Outra forma é considerar que, após um certo tempo, os rótulos verdadeiros estarão disponíveis, o que é aplicável em grande parte dos cenários do mundo real. A utilização de conceitos da teoria dos conjuntos fuzzy possibilita tornar o aprendizado adaptável a possíveis imprecisões nos dados. No entanto, poucas abordagens utilizam os conceitos da teoria dos conjuntos fuzzy e consideram latência intermediária para obtenção dos rótulos. Diante disso, este trabalho propõe um método para classificação de DN multiclasse em FCD para cenários de latência intermediária e extrema baseada nos algoritmos ECSMiner e PFuzzND. Os resultados obtidos mostram que o algoritmo proposto obteve boa acurácia na classificação e detecção de novidades multiclasse, classificando outliers que abordagens que utilizam agrupamento crisp não conseguiram classificar. Além disso, foram apresentadas melhorias em relação aos parâmetros de inicialização do algoritmo, que reduzem a complexidade de sua utilização, mantendo bons resultados.por
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCCpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOpor
dc.description.sponsorshipId001por
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/3601289671291571por


Ficheros en el ítem

Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivs 3.0 Brazil
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivs 3.0 Brazil