Aprimoramento da detecção de câncer em bases de imagens limitadas: uma abordagem baseada em ensemble e aumento de dados
| dc.contributor.advisor1 | Suzuki, Adriano Kamimura | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/4579497412852854 | |
| dc.contributor.advisor1orcid | https://orcid.org/0000-0002-4256-4694 | |
| dc.contributor.author | Moraes Neto, Fernando Humberto de Almeida | |
| dc.contributor.authorlattes | http://lattes.cnpq.br/5446300739482164 | |
| dc.contributor.authororcid | https://orcid.org/0009-0002-3606-1414 | |
| dc.date.accessioned | 2025-03-26T21:20:29Z | |
| dc.date.issued | 2025-02-18 | |
| dc.description.abstract | Recently, Deep Learning models have gained a lot of prominence in the area of image analysis, but they need a lot of data to perform well. This makes the application in medical databases difficult, since there is a difficulty in obtaining many observations equally, between different cases, such as pathological and normal. For small databases, models of learning transfer, ensemble and data augmentation can be used to have better performance in the task of classifying images, while for unbalanced databases, resampling techniques such as undersampling and oversampling can be used. In this work we propose a new approach based on the ensemble of transfer learning models with different weights to improve the prediction of minority class observations in small unbalanced databases considering resampling and data augmentation. At the end, two experiments are carried out, the first with the database from the Hospital A.C.Camargo Cancer Center, which is an oncology hospital specialized in the diagnosis, treatment and research of cancer. This database has never been used for any type of analysis and its objective is to classify mammography images as malignant or benign. The second experiment is a database of benign or malignant skin cancer images from ISIC 2016. From the results obtained, it is noted that the combinations with the best metrics are obtained with the use of resampling and the worst without the use of this technique. This proves that the use of the resampling methodology (undersampling and oversampling) improves the performance of the combination in predicting the minority class. Yet, with the use of data augmentation, the proposed combinations have a better performance than not using this technique. | eng |
| dc.description.resumo | Recentemente os modelos de Deep Learning têm ganhado muito destaque na área de análise de imagem, porém necessitam de muitos dados para terem bons desempenhos. Isto dificulta a aplicação em bases de dados médicas visto que existe uma dificuldade em se obter muitas observações equiparadamente, entre os diferentes casos como, por exemplo, patológicos e normais. Para bases de dados pequenas pode-se utilizar modelos de transferência de aprendizado, ensemble e aumento de dados para se ter melhores desempenhos na tarefa de classificar imagens, já para base de dados desbalanceadas pode-se utilizar técnicas de reamostragem como undersampling e oversampling. Neste trabalho propomos uma nova abordagem baseada no ensemble de modelos de transferência de aprendizado com diferentes pesos para melhorar a predição de observações da classe minoritária em pequenas bases de dados desbalanceadas considerando reamostragem e aumento de dados. Dois experimentos foram realizados, o primeiro com a base de dados do Hospital A.C.Camargo Cancer Center, que é um hospital oncológico especializado no diagnóstico, tratamento e pesquisa de câncer. Esta base de dados nunca foi utilizada para nenhum tipo de análise e tem-se como objetivo classificar imagens de mamografia como malignas ou benignas. O segundo experimento é uma base de dados de imagens de câncer de pele benignas ou malignas do ISIC 2016. A partir dos resultados obtidos nota-se que as combinações com melhores métricas são obtidas com a utilização de reamostragem e as piores sem a utilização desta técnica. O que comprova que a utilização da metodologia de reamostragem (undersampling e oversampling) melhora o desempenho da combinação em prever a classe minoritária. Ainda, com a utilização de aumento de dados, as combinações propostas tem um melhor desempenho do que a não utilização desta técnica. | |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | |
| dc.description.sponsorshipId | 88887.716359/2022-00 | |
| dc.identifier.citation | MORAES NETO, Fernando Humberto de Almeida. Aprimoramento da detecção de câncer em bases de imagens limitadas: uma abordagem baseada em ensemble e aumento de dados. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21688. | * |
| dc.identifier.uri | https://hdl.handle.net/20.500.14289/21688 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de São Carlos | |
| dc.publisher.address | Câmpus São Carlos | |
| dc.publisher.initials | UFSCar | |
| dc.publisher.program | Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs | |
| dc.rights | Attribution-NonCommercial 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc/3.0/br/ | |
| dc.subject | Rede neural convolucional | |
| dc.subject | Transferência de aprendizado | |
| dc.subject | Ensemble, | |
| dc.subject | Aumento de dados | |
| dc.subject | Undersampling | eng |
| dc.subject | Oversampling | eng |
| dc.subject | Convolutional neural network | eng |
| dc.subject | Transfer learning | eng |
| dc.subject | Data augmentation | eng |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS | |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA | |
| dc.title | Aprimoramento da detecção de câncer em bases de imagens limitadas: uma abordagem baseada em ensemble e aumento de dados | |
| dc.title.alternative | Improving cancer detection in limited image bases: an ensemble-based and data augmentation approach | eng |
| dc.type | Tese |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Tese_Fernando_Moraes_corrigida.pdf
- Tamanho:
- 6.77 MB
- Formato:
- Adobe Portable Document Format