Classificação em três classes (normal, bacteriana e viral) em radiografias de tórax usando MobileNetv2 e Grad-Cam
| dc.contributor.advisor1 | França, Celso Aparecido de | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/4547836128892982 | |
| dc.contributor.author | Almeida, Miguel Felipe de | |
| dc.date.accessioned | 2026-06-08T19:14:04Z | |
| dc.date.issued | 2026-06-02 | |
| dc.description.abstract | Pneumonia is a respiratory disease of significant clinical and epidemiological relevance, whose initial investigation often involves the analysis of chest radiographs. However, the interpretation of these images can be challenging due to subtle radiographic patterns, overlapping anatomical structures, variations in image quality, and similarities among different pulmonary manifestations. In this context, deep learning techniques have been widely investigated as support tools for medical image analysis. This work aimed to develop and evaluate an automatic system for classifying chest X-rays into three classes: Normal, Bacterial Pneumonia, and Viral Pneumonia, using transfer learning with MobileNetV2, a lightweight convolutional neural network architecture, and visual analysis of predictions through Grad-CAM, an interpretability technique based on activation maps. For this purpose, a public chest X-ray dataset was used and reorganized into three categories based on the original file structure and filename patterns. The images were divided into training, validation, and test sets, resized to the MobileNetV2 input format, and submitted to a preprocessing workflow compatible with the adopted architecture. The training process was conducted in two stages: initially with the convolutional base frozen and, subsequently, with partial fine-tuning of the final layers of the network. The model performance was evaluated using accuracy, precision, recall, F1-score, confusion matrix, and a complementary analysis with a calibrated decision threshold. On the test set, the MobileNetV2 model achieved an accuracy of 80.13%, with the best performance observed for the Bacterial Pneumonia class and greater difficulty in distinguishing between the Normal and Viral Pneumonia classes. The complementary analysis with the calibrated threshold increased the accuracy to 80.45%, representing a slight improvement over the baseline model. In addition, the Grad-CAM maps made it possible to observe the image regions that most influenced the network decisions, contributing to a qualitative analysis of the predictions. The results indicate that the proposed approach is technically feasible as a support method for multiclass chest X-ray classification, combining satisfactory performance, low computational cost, and visual interpretability. However, the model should not be interpreted as an autonomous diagnostic tool, since it presents limitations related to the dataset, the absence of external clinical validation, and the inherent difficulty of separating visually similar radiographic patterns. | eng |
| dc.description.resumo | A pneumonia é uma doença respiratória de grande relevância clínica e epidemiológica, cuja investigação inicial frequentemente envolve a análise de radiografias de tórax. Entretanto, a interpretação dessas imagens pode ser desafiadora devido à presença de padrões radiográficos sutis, sobreposição de estruturas anatômicas, variações de qualidade da imagem e semelhanças entre diferentes manifestações pulmonares. Nesse contexto, técnicas de aprendizado profundo têm sido amplamente investigadas como ferramentas de apoio à análise de imagens médicas. Este trabalho teve como objetivo desenvolver e avaliar um sistema de classificação automática de radiografias de tórax em três classes: Normal, Pneumonia Bacteriana e Pneumonia Viral, utilizando aprendizado por transferência com a MobileNetV2, uma arquitetura de rede neural convolucional leve, e análise visual das predições por meio do Grad-CAM, técnica de interpretabilidade baseada em mapas de ativação. Para isso, foi utilizada uma base pública de radiografias de tórax, reorganizada em três categorias a partir da estrutura e da nomenclatura dos arquivos. As imagens foram divididas em conjuntos de treinamento, validação e teste, redimensionadas para o formato de entrada da MobileNetV2 e submetidas a um fluxo de pré-processamento compatível com a arquitetura adotada. O treinamento foi conduzido em duas etapas: inicialmente com a base convolucional congelada e, posteriormente, com ajuste fino parcial das camadas finais da rede. O desempenho do modelo foi avaliado por meio de acurácia, precisão, revocação, F1-score, matriz de confusão e análise complementar com limiar calibrado. No conjunto de teste, o modelo MobileNetV2 obteve acurácia de 80,13%, com melhor desempenho para a classe Pneumonia Bacteriana e maior dificuldade na distinção entre as classes Normal e Pneumonia Viral. A análise complementar com limiar calibrado elevou a acurácia para 80,45%, representando um ganho discreto em relação ao modelo base. Além disso, os mapas Grad-CAM permitiram observar as regiões da imagem que mais influenciaram as decisões da rede, contribuindo para uma análise qualitativa das predições. Os resultados indicam que a abordagem proposta é tecnicamente viável para apoio à classificação multiclasse de radiografias de tórax, combinando desempenho satisfatório, baixo custo computacional e interpretabilidade visual. Contudo, o modelo não deve ser interpretado como ferramenta diagnóstica autônoma, uma vez que apresenta limitações relacionadas à base de dados, à ausência de validação clínica externa e à dificuldade inerente de separação entre padrões radiográficos semelhantes. | por |
| dc.description.sponsorship | Não recebi financiamento | |
| dc.identifier.citation | ALMEIDA, Miguel Felipe de. Classificação em três classes (normal, bacteriana e viral) em radiografias de tórax usando MobileNetv2 e Grad-Cam. 2026. Trabalho de Conclusão de Curso (Graduação em Engenharia Elétrica) – Universidade Federal de São Carlos, Campus São Carlos, 2026. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/24215. | * |
| dc.identifier.uri | https://hdl.handle.net/20.500.14289/24215 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de São Carlos | |
| dc.publisher.address | Campus São Carlos | |
| dc.publisher.center | Centro de Ciências Exatas e de Tecnologia - CCET | |
| dc.publisher.course | Engenharia Elétrica - EE | |
| dc.publisher.initials | UFSCar | |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | |
| dc.subject | Pneumonia | por |
| dc.subject | Radiografia de tórax; | por |
| dc.subject | Chest X-ray | eng |
| dc.subject | Aprendizado profundo | por |
| dc.subject | Deep learning | eng |
| dc.subject | MobileNetV2 | eng |
| dc.subject | Grad-CAM | |
| dc.subject.cnpq | ENGENHARIAS::ENGENHARIA ELETRICA | |
| dc.subject.ods | 3. Saúde e Bem-Estar | |
| dc.title | Classificação em três classes (normal, bacteriana e viral) em radiografias de tórax usando MobileNetv2 e Grad-Cam | por |
| dc.title.alternative | Classification into three classes (normal, bacterial, and viral) in chest radiographs using MobileNetv2 and Grad-Cam. | eng |
| dc.type | TCC |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- TCC_Miguel_final.pdf
- Tamanho:
- 11.81 MB
- Formato:
- Adobe Portable Document Format