Aprimoramento da detecção de câncer em bases de imagens limitadas: uma abordagem baseada em ensemble e aumento de dados

dc.contributor.advisor1Suzuki, Adriano Kamimura
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4579497412852854
dc.contributor.advisor1orcidhttps://orcid.org/0000-0002-4256-4694
dc.contributor.authorMoraes Neto, Fernando Humberto de Almeida
dc.contributor.authorlatteshttp://lattes.cnpq.br/5446300739482164
dc.contributor.authororcidhttps://orcid.org/0009-0002-3606-1414
dc.date.accessioned2025-03-26T21:20:29Z
dc.date.issued2025-02-18
dc.description.abstractRecently, Deep Learning models have gained a lot of prominence in the area of image analysis, but they need a lot of data to perform well. This makes the application in medical databases difficult, since there is a difficulty in obtaining many observations equally, between different cases, such as pathological and normal. For small databases, models of learning transfer, ensemble and data augmentation can be used to have better performance in the task of classifying images, while for unbalanced databases, resampling techniques such as undersampling and oversampling can be used. In this work we propose a new approach based on the ensemble of transfer learning models with different weights to improve the prediction of minority class observations in small unbalanced databases considering resampling and data augmentation. At the end, two experiments are carried out, the first with the database from the Hospital A.C.Camargo Cancer Center, which is an oncology hospital specialized in the diagnosis, treatment and research of cancer. This database has never been used for any type of analysis and its objective is to classify mammography images as malignant or benign. The second experiment is a database of benign or malignant skin cancer images from ISIC 2016. From the results obtained, it is noted that the combinations with the best metrics are obtained with the use of resampling and the worst without the use of this technique. This proves that the use of the resampling methodology (undersampling and oversampling) improves the performance of the combination in predicting the minority class. Yet, with the use of data augmentation, the proposed combinations have a better performance than not using this technique.eng
dc.description.resumoRecentemente os modelos de Deep Learning têm ganhado muito destaque na área de análise de imagem, porém necessitam de muitos dados para terem bons desempenhos. Isto dificulta a aplicação em bases de dados médicas visto que existe uma dificuldade em se obter muitas observações equiparadamente, entre os diferentes casos como, por exemplo, patológicos e normais. Para bases de dados pequenas pode-se utilizar modelos de transferência de aprendizado, ensemble e aumento de dados para se ter melhores desempenhos na tarefa de classificar imagens, já para base de dados desbalanceadas pode-se utilizar técnicas de reamostragem como undersampling e oversampling. Neste trabalho propomos uma nova abordagem baseada no ensemble de modelos de transferência de aprendizado com diferentes pesos para melhorar a predição de observações da classe minoritária em pequenas bases de dados desbalanceadas considerando reamostragem e aumento de dados. Dois experimentos foram realizados, o primeiro com a base de dados do Hospital A.C.Camargo Cancer Center, que é um hospital oncológico especializado no diagnóstico, tratamento e pesquisa de câncer. Esta base de dados nunca foi utilizada para nenhum tipo de análise e tem-se como objetivo classificar imagens de mamografia como malignas ou benignas. O segundo experimento é uma base de dados de imagens de câncer de pele benignas ou malignas do ISIC 2016. A partir dos resultados obtidos nota-se que as combinações com melhores métricas são obtidas com a utilização de reamostragem e as piores sem a utilização desta técnica. O que comprova que a utilização da metodologia de reamostragem (undersampling e oversampling) melhora o desempenho da combinação em prever a classe minoritária. Ainda, com a utilização de aumento de dados, as combinações propostas tem um melhor desempenho do que a não utilização desta técnica.
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.description.sponsorshipId88887.716359/2022-00
dc.identifier.citationMORAES NETO, Fernando Humberto de Almeida. Aprimoramento da detecção de câncer em bases de imagens limitadas: uma abordagem baseada em ensemble e aumento de dados. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21688.*
dc.identifier.urihttps://hdl.handle.net/20.500.14289/21688
dc.language.isopor
dc.publisherUniversidade Federal de São Carlos
dc.publisher.addressCâmpus São Carlos
dc.publisher.initialsUFSCar
dc.publisher.programPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.rightsAttribution-NonCommercial 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc/3.0/br/
dc.subjectRede neural convolucional
dc.subjectTransferência de aprendizado
dc.subjectEnsemble,
dc.subjectAumento de dados
dc.subjectUndersamplingeng
dc.subjectOversamplingeng
dc.subjectConvolutional neural networkeng
dc.subjectTransfer learningeng
dc.subjectData augmentationeng
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
dc.titleAprimoramento da detecção de câncer em bases de imagens limitadas: uma abordagem baseada em ensemble e aumento de dados
dc.title.alternativeImproving cancer detection in limited image bases: an ensemble-based and data augmentation approacheng
dc.typeTese

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Tese_Fernando_Moraes_corrigida.pdf
Tamanho:
6.77 MB
Formato:
Adobe Portable Document Format