Análise de plágio em código fonte usando similaridade de sinal 1D

dc.contributor.advisor1Backes, André Ricardo
dc.contributor.advisor1Latteshttps://lattes.cnpq.br/8590140337571249
dc.contributor.authorMancuzo, Kaique Venuto
dc.date.accessioned2025-03-21T17:12:18Z
dc.date.issued2025-02-26
dc.description.abstractSource code plagiarism is a recurring issue in academia, and its manual detection is a highly time-consuming task due to the large volume of assignments in programming courses. To address this, this study proposes an approach to measuring similarity between source codes using signal processing techniques, treating them as one-dimensional signals. The hypothesis is that this approach may be more resistant to obfuscation techniques than conventional methods. Three approaches were explored: time-domain analysis, Fourier Transform, and Wavelet Transform. The applied metrics were evaluated on datasets containing previously identified cases of plagiarism and compared with the MOSS and JPlag tools. The results indicate that time-domain analysis, particularly with Dynamic Time Warping (DTW) distance and Pearson correlation, was the most effective in identifying plagiarism, achieving performance comparable to traditional tools.eng
dc.description.resumoO plágio em código-fonte é um problema recorrente no meio acadêmico, e sua detecção manual torna-se inviável devido ao alto volume de trabalhos desenvolvidos em disciplinas de programação. Diante disso, este trabalho propõe uma abordagem que mede a similaridade entre códigos-fonte por meio de técnicas de processamento de sinais, tratando-os como sinais unidimensionais. Parte-se da hipótese de que essa abordagem pode ser mais resistente a técnicas de ofuscação do que os métodos convencionais. Foram exploradas três abordagens: análise no domínio do tempo, com Transformada de Fourier e Transformada de Wavelet. As métricas aplicadas foram avaliadas em bases de códigos contendo casos previamente identificados de plágio e comparadas com as ferramentas MOSS e JPlag. Os resultados indicam que a análise no domínio do tempo, especialmente com a Distância DTW e a Correlação de Pearson, apresentou maior eficácia na identificação de plágio, aproximando-se do desempenho das ferramentas tradicionais.
dc.identifier.citationMANCUZO, Kaique Venuto. Análise de plágio em código fonte usando similaridade de sinal 1D. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21615.por
dc.identifier.urihttps://hdl.handle.net/20.500.14289/21615
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCampus São Carlos
dc.publisher.courseEngenharia de Computação - EC
dc.publisher.initialsUFSCar
dc.rightsAttribution 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/
dc.subjectDetecção de plágio
dc.subjectAnálise de sinais
dc.subjectTransformada de Fourier
dc.subjectTransformada de Wavelet
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.titleAnálise de plágio em código fonte usando similaridade de sinal 1D
dc.title.alternativePlagiarism analysis in source code using 1D signal similarityeng
dc.typeTCC

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCC-KaiqueMancuzo-VFinalCorrecoes.pdf
Tamanho:
3.33 MB
Formato:
Adobe Portable Document Format

Coleções