Clasificación de Imágenes de Neumonía a causa de Covid-19 utilizando Transfer-Learning basado en Redes Convolucionales

Adiel Joshua Preciado Rodríguez1*; Flor Mayerli Flores Guillen1; Aldo Emanuel Soraluz Soraluz1; Jonathan Gerhard Ríos Jara1

Correspondence: *. Autor para la correspondencia: E-mail:
* Los autores declaramos que no tenemos ningún tipo de conflicto de interés en este trabajo con ninguna organización académica y/o comercial.
Contributed by footnote: Bach. Adiel Joshua Preciado Rodríguez: Levantamiento de las observaciones presentadas en coordinación con los demás autores, aportaciones importantes a la idea y diseño del estudio.
* Bach. Flor Mayerli Flores Guillen y Bach. Aldo Emanuel Soraluz Soraluz: Metodología, contribución en la conceptualización de la idea del estudio, redactores y revisores críticos del documento.
Contributed by footnote: Bach. Jonathan Gerhard Ríos Jara: Apoyo en la recogida, análisis e interpretación de datos, asimismo las aportaciones importantes a la idea y diseño del estudio.


RESUMEN

La Inteligencia Artificial ha ayudado a lidiar diferentes problemas relacionados con los datos masivos y a su vez con su tratamiento, diagnóstico y detección de enfermedades como la que actualmente nos preocupa, la Covid-19. El objetivo de esta investigación ha sido analizar y desarrollar la clasificación de imágenes de neumonía a causa de covid-19 para un diagnostico efectivo y óptimo. Se ha usado Transfer-Learning aplicando ResNet, DenseNet, Poling y Dense layer para la elaboración de los modelos de red propios Covid-UPeU y Covid-UPeU-TL, utilizando las plataformas Kaggle y Google colab, donde se realizaron 4 experimentos. El resultado con una mejor clasificación de imágenes se obtuvo en el experimento 4 prueba N°2 con el modelo Covid-UPeU-TL donde Acc.Train: 0.9664 y Acc.Test: 0.9851. Los modelos implementados han sido desarrollados con el propósito de tener una visión holística de los factores para la optimización en la clasificación de imágenes de neumonía a causa de COVID-19.

Received: 2021 May 2; Accepted: 2022 January 17

rcim. 2022 Jun 1; 14(1): e471

Keywords: Palabras clave: covid-19, transfer-learning, reconocimiento, inteligencia artificial, pandemia, rayos x, clasificación de imágenes, pulmones, redes convolucionales.
Keywords: Keywords: COVID-19, Transfer-Learnig, Recognition, Artificial intelligence, Pandemic, X-rays, Image classification, Lungs, convolutional networks.

Introducción

El 31 de diciembre de 2019 se presentaron en la ciudad de Wuhan (China) 27 casos de neumonía con causa desconocida, los cuales fueron informados a la Organización Mundial de la salud 1),(2. El 3 de enero de 2020 China notificó a la OMS haber encontrado 44 casos de esta neumonía, de los cuales 11 personas se encontraban en gravedad y otras 33 se encontraban en una situación estable. El 12 de febrero el director general de la OMS 3 dio alerta de la existencia de la nueva enfermedad.

La inteligencia artificial ha mejorado los avances del desarrollo tecnológico mundial, en los últimos años ha ido evolucionando como una disciplina dedicada a la construcción de herramientas tecnológicas capaces de apoyar en el desarrollo de soluciones para casos de la medicina humana, el diagnóstico o la predicción de enfermedades, como la que actualmente nos preocupa, la pandemia mundial Covid-19, afirman Weiss 4 y Ahuja 5.

Las tareas constituyen la clave para llegar a los métodos o técnicas de la inteligencia artificial (Lógica difusa, Redes Neuronales Artificiales, Naive Bayes, Arboles de Decisión, etc), ya que la correcta codificación y resolución de problemas son de primera instancia para la toma adecuada de decisiones 6),(7.

Asimismo según Cortés8, las técnicas de Transfer Learnig (TL) vienen avanzando con éxito en el procesamiento de imágenes, su extracción, reconocimiento y clasificación. Una de las técnicas de TL utilizadas para el análisis de imágenes es la de Redes Neuronales Convolucionales Profundas (DCNN por sus siglas en inglés: Deep Convolutional Neural Networks), que desde mediados del siglo XX hasta el 2020 han demostrado su capacidad para resolver problemas de clasificación en imágenes, proporcionando resultados satisfactorios en una amplia gama de aplicaciones 9.

La pandemia ocasionada por la Covid-19 ha ido desencadenando efectos devastadores tanto en la economía como en la salud y en la población mundial 1. El uso de la inteligencia artificial, ha permitido analizar datos masivos representados en Datasets, ayudando a la comunidad científica en la detección temprana de Covid-19, como lo afirman 10), (11.

En esta investigación se ha desarrollado y analizado la clasificación de imágenes de neumonía para un diagnostico efectivo y óptimo entre un pulmón normal y uno con Covid-19, a través de modelos propios entrenados, haciendo uso de Transfer-Learnig e inteligencia artificial como parte de una innovación tecnológica sanitaria.

Método

Para el reconocimiento de imágenes se ha hecho uso de DCNN: un modelo de neuronas que corresponden a campos receptivos, de una manera muy similar a las neuronas de la corteza visual primaria de un cerebro biológico, mencionan Zhou12) y Curioso13.

Las unidades de procesamiento se han organizado en capas; una capa de entrada que representa los campos de entrada de una o varias capas ocultas; y una capa de salida, con una unidad o unidades que representa el campo o los campos de destino 14.

Asimismo, la función de la capa convolucional ha sido el de procesar la salida de las neuronas conectadas 15, las cuales han extraído características de las imágenes pulmonares, a través de un conjunto de filtros entrenables cuyos valores han sido aprendidos al encontrar ciertas características.

Se ha hecho uso de Pooling, un algoritmo utilizado para la reducción de dimensiones, con el objetivo de minimizar los tiempos de procesamiento y preservar información importante, evitando el sobreajuste y robusteciendo el modelo.

La capa totalmente conectada (Dense Layer) ha cumplido la función de clasificador, ya que ha realizado la clasificación de imágenes basada en características, las cuales han sido extraídas por las capas de convolución y la capa de agrupación (Pooling). La capa totalmente conectada es la capa de salida y representa las probabilidades de las clases o categorías en la tarea de clasificación, según Quintero 15.

Para el funcionamiento de este modelo se ha cumplido con las siguientes funciones de una red Convolucional:

  • Inicializar todos los pesos con valores.
  • Utilizar las imágenes de entrenamiento en el modelo.
  • Calcular el error total de las probabilidades resultantes.
  • Propagar hacia atrás para calcular el error de la gradiente de acuerdo a los pesos obtenidos en la red.
  • Utilizar la gradiente descendiente para actualizar los pesos con valores y minimizar el error de salida.

Asimismo se han recopilado imágenes de Rayos X pulmonar obtenidos de Kaggle, una plataforma web de aprendizaje automático, donde se han extraído los Dataset de “Chest X-Ray Imágenes Pneumonia”16 y “CoronaHack-Chest X-Ray-Dataset”17.

Las imágenes recopiladas han sido convertidas al formato JPEG, en un tamaño inferior a 300 pixeles, para luego ser almacenadas y separadas en carpetas de Train y Test en Google Drive; el conjunto ha estado conformado por un total de 4000 imágenes, con la finalidad de obtener un modelo óptimo y efectivo, asimismo estas imágenes han sido procesadas en Google Colab donde se encontraba alojado el modelo de red neuronal para el proceso experimental a través de entrenamientos reiterados.

Goole Colab es un entorno de máquinas virtuales en la nube basado en Jupyter Noteboks, Colab ha ido difundiendo la educación y la investigación en el aprendizaje automático afirma Bodero 18. Por otro lado, otorga un acceso gratuito a una GPU robusta, se ha utilizado la interfaz de administración del sistema NVIDIA (nvidia-smi) y los Megabytes de espacio y uso de GPU asignados.

Se realizaron 4 experimentos: los experimentos 1, 2 y 3 se llevaron a cabo con el modelo propio Covid-Upeu y el experimento 4 con el modelo propio Covid-UpeU-TL orientado en Densenet y Resnet; aplicando los modelos mencionados se buscó obtener la mejor clasificación de imágenes de pulmones sanos y pulmones con Covid-19.

La importancia de una correcta normalización y organización del Dataset radica en su composición 19 , ya que ha sido la base fundamental para el análisis, detección y desarrollo del modelo de red neuronal para una correcta clasificación.

Cada autor de esta investigación ha hecho uso de computadoras portátiles para una mejor experiencia personal y una mejor comparación grupal de los resultados obtenidos.

Modelos propios

Modelo 1, Covid-UPeU fue el primer modelo en realizarse y a la vez el primero en obtener resultados basados en redes neuronales, tal como se muestra en la Figura 1.


[Figure ID: f1] Fig.1.

Modelo Covid-UPeU.


Modelo 2, Covid-UPeU-TL fue el segundo modelo en llevarse a cabo, hace uso de Transfer Learning introduciendo RESNET y DENSENET para los datos de doble o triple capa; centrado en el almacenamiento de conocimiento adquirido mientras se resuelve un problema, tal como se muestra en la Figura 2 y 3.


[Figure ID: f2] Fig. 2.

Modelo Covid-UPeU-TL - DENSENET



[Figure ID: f3] Fig. 3.

Modelo Covid-UPeU-TL - RESNET


Weiss4 menciona que el conocimiento adquirido ha sido útil cuando no se poseen datos suficientes para un nuevo dominio que se desea manejar a través de una red neuronal.

Resultados

Para la obtención de los resultados se decidió realizar 4 experimentos, lo cuales han estado basados en Dataset utilizados como inputs y han pasado por el proceso de normalización de transformaciones en PyTorch donde el tamaño ha sido de 224 x 224 para dar un aumento de datos, luego han pasado por la transformación de tensores y la función de transformación normalizada con valores del promedio y el estándar del conjunto de datos, dando un mejor tratamiento de los datos, asimismo se aplicaron los modelos propios Covid-UPeU y Covid-UPeU-TL (Densenet y Resnet).

Por otro lado, la selección del mejor resultado de cada experimento estuvo basado en Acc.Train y Acc.Test, donde el resultado del Acc.Train han sido imágenes que el modelo no vio y el Acc.Test han sido imágenes que el modelo clasificó, asimismo si el resultado de Acc.Train es mayor al resultado del Acc.Test el margen de error es mayor al resultado de la clasificación de imágenes por la tanto no es un resultado óptimo, sin embargo al obtener un mayor resultado en Acc.Test el entrenamiento de clasificación está dando mejores resultados, cumpliendo con el objetivo de la investigación.

En el experimento 1 se aplicó el modelo Covid-Upeu, donde se hizo uso de un total de 162 imágenes máximo y un mínimo de 148, a su vez se han clasificado las imágenes de Rayos X de pulmones sanos y pulmones con Covid-19, las cuales han sido extraídas del Dataset y ordenadas en carpetas de Google Drive para luego ser vinculadas con Google Colab, donde la correcta ruta de ubicación ha sido esencial para no tener problemas en la compilación de la red neuronal.

Asimismo, se realizaron 4 pruebas con diferentes cantidades de imágenes y épocas las cuales nos ayudan a verificar cual es el mejor resultado en la clasificación. En la prueba N°4 se obtuvo un mejor resultado con un total de 168 imágenes y 77 épocas, con Acc.Train: 0.9198 y Acc.Test: 0.9500, tal como se muestra en la tabla 1 y figura 4.

Tabla 1.

Resultados del Experimento 1.


N° prueba Imágenes Épocas Tiempo Acc.Train Acc. Test
1 148 300 32 min 0.9392 0.9000
2 148 20 3 min 0.9257 0.9250
3 148 250 25 min 0.9392 0.9250
4 168 77 15 min 0.9198 0.9500


[Figure ID: f4] Fig. 4.

Experimento 1-Clasificación de un pulmón normal y uno con covid-19 a un Acc.Train de 0.9198 y Acc.Test de 0.9500, aplicando el modelo Covid-UPeU.


En el experimento 2 se aplicó el modelo Covid-UPeU, donde se optó por aumentar las imágenes a un máximo de 1636 y un mínimo de 805 lo cual dio un resultado favorable pero no el esperado, asimismo se realizaron 4 pruebas para verificar la variación del resultado en épocas e imágenes, además se utilizó el método de normalización el cual ha doblegado las imágenes de su versión normal. Por lo tanto, el mejor resultado se ha obtenido en la prueba N°3 donde Acc.Train: 0.8270 y Acc.Test: 0.8702, tal como se muestra en la tabla 2 y figura 5.

Tabla 2.

Resultado del Experimento 2.


N° prueba Imágenes Épocas Tiempo Acc Train Acc Test
1 805 50 28min 0.9578 0.9250
2 1636 20 1h 43min 0.8784 0.7250
3 1636 100 25min 0.8270 0.8702
4 930 55 31min 0.8559 0.9155


[Figure ID: f5] Fig. 5.

Experimento 2 Clasificación de un pulmón normal y uno con covid-19 usando el método de Normalización a un Acc.train de 0.8270 y Acc.test de 0.8702, aplicando el modelo Covid-UPeU.


En el experimento 3 fue aplicado el modelo Covid-UPeU, donde se optó por obtener la media y la varianza del conjunto de imágenes, para luego ser estandarizado en la fase de normalización del modelo de red. Por otro lado, en la prueba N°2 se optó por cambiar los datos de normalización de 3 a sólo 1, el cual era la media; se obtuvo un resultado bastante óptimo en la prueba N°3, donde Train: 0.8796, Accucary: 0.9119 tal como se muestra en la tabla 3 y en la figura 6.

Tabla 3.

Resultado del Experimento 3.


N° prueba Imágenes Épocas Tiempo Acc Train Acc Test
1 2,645 100 1h 49min 0.8881 0.9098
2 2,948 100 2h 36min 0.8803 0.3750
3 1,770 79 53min 0.8796 0.9119
4 1,640 75 1h 4min 0.8735 0.6250


[Figure ID: f6] Fig. 6.

Experimento 3 Clasificación de un pulmón normal y uno con covid-19 usando el método de normalización con Media y Varianza a un Acc.Train de 0.8796 y un Acc.Test de 0.9119, aplicando el modelo Covid-UPeU.


En el experimento 4 se aplicó el modelo Covid-UPeU-TL, donde se adicionó una línea de código diferente para cada entrenamiento o N° de prueba, es decir se han aplicado DenseNet y ResNet los cuales fueron entrenados de forma individual ya que ambos modelos han sido pre-entrenados de la base de datos de ImageNet, esta prueba ha permitido la optimización de los pesos y como mejor resultado en la prueba N°2 se ha obtenido un Acc.Train: 0.9664 y un Acc.Test de 0.9851. Asimismo, el máximo de imágenes utilizadas ha sido de 3000 y un mínimo de 1600. Se muestra en la tabla 4 y la figura 7.

Tabla 4.

Resultado del Experimento 4.


N° prueba Imágenes Épocas Tiempo Acc Train Acc Test
1 2,948 25 5h 38min 0.9732 0.0750
2 2,645 100 3h 21min 0.9664 0.9851
3 1,676 100 2h 39min 0.9639 0.9250
4 2,887 68 2h 9min 0.9839 0.0786


[Figure ID: f7] Fig. 7.

Experimento 4 Clasificación de un pulmón normal y uno con covid-19 aplicando DenseNet y ResNet con un Acc.Train de 0.9664 y un Acc.Test 0.9851, aplicando el modelo Covid-UPeU-TL.


Al usar una red con mayor cantidad de capas e imágenes en el modelo CovidUPeU-TL se ha tenido un tiempo de entrenamiento más prolongado que los resultados previos, dando así resultados satisfactorios.

Discusión y Conclusiones

Los modelos implementados se desarrollaron con el propósito de tener una visión holística de los factores para la optimización en la clasificación de imágenes de COVID-19, tratando en este caso de realizar una contribución a la salud y con el propósito de ser un punto de referencia para trabajos futuros tal como lo mencionan 20, como la integración con imágenes de neumonía en Perú u otras enfermedades que puedan involucrar problemas pulmonares.

Se obtuvieron diferentes resultados en los 4 experimentos; el entrenamiento con mejor resultado se halló en el experimento 4 (prueba N°2), donde se aplicó el modelo Covid-UPeU-TL el cual fue entrenado con 100 épocas y un total de 2645 imágenes, el tiempo de ejecución fue de un total de 2horas con 39min y 19sg. Es por ello que se tuvo como referencia el estudio realizado por 21, el cual presenta nuevos modelos de CNN para la detección de COVID 19 y otros casos de neumonía haciendo uso de imágenes Rayos X, donde el resultado óptimo se obtuvo con el modelo ResNet, con una precisión satisfactoria del 99,17%, el cual es una clasificación binaria (COVID-19 y No -COVID). Concluyendo que el uso de imágenes Rayos X y Redes neuronales convolucionales logren un impacto en diferentes escenarios de clasificación y diagnóstico.

El uso de la inteligencia artificial puede ayudar en el diagnóstico efectivo a través de modelos entrenados y óptimos, permitiendo el ahorro de recursos y la certeza de los resultados, con un proceso automatizado de clasificación, donde su integración con otros elementos podría significar el inicio de un nuevo avance tecnológico.


Referencias
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.


Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional.