Informações
Título do produto
Detecção da Covid-19 em imagens de raio-x : construindo um novo modelo de aprendizado profundo utilizando AutoML
Descrição do produto
Referência:
BEDUIN, Igor Raposo Oliveira. Detecção da Covid-19 em imagens de raio-x: construindo um novo modelo de aprendizado profundo utilizando AutoML. 2021. 94 f., il. Trabalho de conclusão de curso (Bacharelado em Engenharia Mecatrônica) — Universidade de Brasília, Brasília, 2021.
Resumo:
No início de 2020 o mundo foi surpreendido pela nova pandemia global de COVID-19. Sendo uma doença altamente transmissível, a testagem em massa da população ainda é uma das medidas mais importantes na contenção da disseminação da doença. Baseado então na recente onda de Redes Neurais Convolucionais com excelentes resultados em tarefas de classificação de imagens, este trabalho propõe um novo modelo residual gerado pelo AutoKeras, o AutoResCovidNet, para classificação multiclasse baseado em imagens de Raio-X de pessoas saudáveis, com pneumonia e diagnóstico confirmado de COVID-19, comparando ao fim com outros resultados da literatura. O trabalho apresentado neste manuscrito tem como objetivo mostrar que um modelo funcional base pode ser obtido a partir de métodos de AutoML. Assim, este trabalho descreve todas as etapas de projeto de um modelo de Aprendizado Profundo. Foi reunido um conjunto de dados com mais12 mil imagens classificadas em "Normal", "Pneumonia" e "COVID-19". Este conjunto completo foi utilizado para busca de modelos com AutoKeras na família das ResNets, utilizando técnicas de pré-processamento a fim de se melhorar a generalização das características. O melhor modelo obtido da saída do AutoKeras foi então utilizado para treinamento do zero aplicando o processo de validação cruzada com split de 80%/20%. Os treinos de modelos na validação cruzada foram feitos com os otimizadores Adam e SGD, utilizando tanto imagens raw quanto imagens com Aumento de Dados. Os modelos foram analisados qualitativamente e quantitativamente respectivamente por curvas ROC e Matrizes de Confusão. Nas duas análises os modelos treinados com conjunto de dados raw tiveram desempenho superior, sendo que o modelo SGD_raw foi o melhor possuindo maior F1-Score. Foi observado também que o pré-processamento para Aumento de Dados foi bastante prejudicial dificultando a generalização das características, indicando que as operações foram demasiadamente agressivas. Apesar de não conseguir alcançar os modelos da literatura, os bons resultados de classificação de duas das três classes indicam que ajustes finos de treinamento e pré-processamento das imagens podem colocar o modelo gerado no patamar do estado-da-arte.
Autor(es) do produto
Igor Raposo Oliveira Beduin
Unidade acadêmica da UnB
Assunto/palavras-chave representativas do produto
Covid-19 - Processamento de imagens - técnicas digitais - Redes neurais (Computação)
Público alvo
Data de Produção do produto
maio 3, 2022
Tipo do produto
Comunicação científica
