Herramientas de monitoreo y control estadístico para enfermedades infecciosas: Caso de la COVID-19 en Cuba
1. Facultad de Matemática y Computación, Universidad de La Habana, Cuba, Universidad de La Habana, Facultad de Matemática y Computación, Universidad de La Habana, Cuba , 2. Facultad “Miguel Enríquez”, Universidad de Ciencias Médicas de La Habana, Cuba, Universidad de Ciencias Médicas de La Habana, Facultad “Miguel Enríquez”, Universidad de Ciencias Médicas de La Habana, Cuba
RESUMEN
En el control de enfermedades infecciosas resulta esencial usar modelos epidemiológicos, sin embargo, existen herramientas que permiten el monitoreo y control estadístico de la transmisión de este tipo de enfermedad en el tiempo. El objetivo de este trabajo de investigación fue proporcionar un análisis de la dinámica diaria de transmisión de la COVID-19 en Cuba mediante dos cartas de control, basadas en un modelo probabilístico fundamentado en las distribuciones binomial y Poisson. Los dos métodos se aplicaron, utilizando los reportes diarios publicados por el Ministerio de Salud Pública, a un proceso cuya variable en estudio es de atributos y con poca información sobre su estabilidad. Las cartas aplicadas fueron clave para mejorar la estabilidad del proceso, en la medida en que se detectaron, identificaron y sugirió la eliminación de causas especiales para reducir la variación; y en el monitoreo para asegurar que las mejoras a generarse se puedan conservar.
Received: 2021 March 23; Accepted: 2021 October 9
Keywords: Palabras clave: control estadístico, cartas de control, atributos, covid- 19.
Keywords: Keywords: statistical control, control charts, attributes, covid-19.
Introducción
En el grupo de modelos teóricos y metodológicos que apoyan los estudios epidemiológicos se encuentra la modelación matemática, que establece un modelo conformado por un conjunto de símbolos y relaciones matemáticas formales que representan una aproximación a las relaciones reales existentes en el objeto de estudio. 1
El empleo de modelos matemáticos para enfermedades infecciosas ha crecido en grado significativo en los últimos años debido a que proporcionan información útil para tomar decisiones e instituir medidas operativas en el control o erradicación de una enfermedad infecciosa. Estos modelos son útiles porque capturan propiedades esenciales de la dispersión de una enfermedad de una forma simplificada. 2
A pesar de las múltiples incertidumbres que a nivel biológico, clínico y epidemiológico, subsisten en relación con el nuevo virus de la familia corona viridae, designado SARS CoV-2 3, lo que ya parece claro es que cada país respondió a la misma amenaza con diferentes medidas y/o con una temporización diferente. Este hecho hizo que las curvas epidemiológicas de los países afectados se comporten de manera distinta, y que el costo social y económico de las respectivas respuestas sea diferente. (4
El objetivo de este trabajo fue proporcionar un análisis del comportamiento de la dinámica diaria de transmisión de la Covid-19 en Cuba mediante dos tipos de cartas de control, basadas en un modelo fundamentado en las distribuciones de probabilidad binomial y Poisson: la carta para proporción de defectuosos y la carta para el número de defectos por unidad.
Estos diagramas posibilitaron estudiar la variabilidad y el comportamiento del número de casos positivos a la enfermedad a través del tiempo, teniendo en cuenta el reporte diario de la cantidad de personas infectadas, por ejemplo en los meses de mayo, junio, julio y agosto de 2020, realizado por el Ministerio de Salud Pública de Cuba (MINSAP) y divulgado por su canal oficial disponible en https://t.me/MINSAPCuba.
Métodos
Como es sabido, los procesos o fenómenos siempre tienen variación, ya que en ellos intervienen diferentes factores. Bajo las condiciones normales o comunes donde se da el proceso, todos los factores aportan variación a las variables de salida del mismo, en forma natural o inherente, pero además aportan variaciones especiales o fuera de lo común, ya que a través del tiempo los factores son susceptibles de cambios, desajustes, errores, descuidos, entre otros. Así, hay dos tipos de variabilidad: la que se debe a causas comunes y la que corresponde a causas especiales.
La variación por causas comunes (o por azar) es aquella que permanece día a día; y es aportada de forma natural por las condiciones de los factores que intervienen. Esta variación es inherente a las reales características del proceso y es resultado de la acumulación y combinación de diferentes causas que son difíciles de identificar y eliminar, ya que son propias al sistema y la contribución individual de cada causa es pequeña; no obstante, a largo plazo representan la mayor oportunidad de mejora.
La variación por causas especiales se debe a situaciones o circunstancias que no están de manera permanente en el proceso. Por ejemplo, la falla ocasionada por el mal funcionamiento de un instrumento, el empleo de materiales no habituales en el proceso, el descuido de un técnico operario de los instrumentos o el incumplimiento de medidas para que solo se den en el proceso las variaciones por causas comunes.
Cuando un proceso se da solo con causas comunes de variación se dice que está en control estadístico o que es estable, porque su comportamiento a través del tiempo es predecible. Además, independientemente de que su variabilidad sea mucha o poca, el desempeño del proceso es predecible en el futuro inmediato, en el sentido de que su tendencia central y la amplitud de su variación se mantienen sin cambios al menos en el corto plazo.
Una carta de control es un diagrama que sirve para observar y analizar la variabilidad y el comportamiento de un proceso a través del tiempo. Su objetivo básico al observar y analizar el comportamiento del proceso es la posibilidad de distinguir entre variaciones por causas comunes y especiales, lo que ayuda a caracterizar el funcionamiento del proceso y decidir las mejores acciones de control. 5
Existen dos tipos de cartas de control: para variables y para atributos. Las cartas de control para variables se aplican a características de naturaleza continua. El límite de esto lo pone la resolución de la escala de medición del instrumento que se utiliza para medirla.
Sin embargo, en un proceso existen también características que no son medidas con un instrumento de medición en una escala continua. En estos casos, el proceso se juzga como conforme o no conforme, dependiendo de si posee o no ciertos atributos. Este tipo de características son monitoreadas a través de las cartas de control para atributos y son las que ocupan a los autores de este trabajo pues estas cartas sirven para registrar valores (llamados atributos) de variables aleatorias discretas.
Una carta de control para atributos, es un diagrama que se aplica al monitoreo de características de calidad del tipo “pasa, o no pasa”, o donde se cuenta el número de no conformidades que tienen los procesos analizados. 5
Un modelo general para una carta de control es como sigue. Sea el estadístico que se va a graficar en la carta, supongamos que su media es y su desviación estándar , entonces el Límite inferior de control (LIC), la línea central y el Límite superior de control (LSC) están dados por:
Con estos límites y bajo condiciones de control estadístico se tendrá una alta probabilidad (de 0,9973 si tiene distribución normal) de que los valores de estén dentro de ellos. 5
Carta para proporción de defectuosos
Supóngase que cuando el proceso (consistente en la dinámica diaria de transmisión de la COVID-19 en Cuba) esté bajo control, la probabilidad de que cualquier caso sea positivo o confirmado a la enfermedad (o indique ser defectuosa) es (o lo que es lo mismo, es la proporción a largo plazo del número de casos positivos a la enfermedad) y que diferentes casos (o personas) son independientes uno de otro con respecto a sus condiciones. Considérese una muestra de personas obtenida diariamente, sea el número de casos positivos a la enfermedad y . Debido a que tiene una distribución binomial, entonces su valor esperado es y su varianza , así y la .
También, si , entonces tiene buena aproximación a la distribución normal. Generalmente el valor de debe estimarse a partir de los datos disponibles en muestras de forma que , por tanto su estimación debe usarse en lugar de en los límites de control antes mencionados.
En consecuencia, la carta tiene su línea central a una altura y sus límites de control dependiendo del tamaño de cada subgrupo están dados por:
Límite inferior de control =
Límite superior de control =
Carta para el número de defectos por unidad
El objetivo de esta carta es el de analizar la variación del número promedio de defectos por unidad, cuando el tamaño del subgrupo no se mantenga constante, en lugar del total de defectos en el subgrupo. Así, en esta carta, un subgrupo lo forman varias unidades.
Los límites de control en esta carta se obtienen suponiendo que el estadístico sigue una distribución Poisson. Debido a que es una variable aleatoria Poisson con parámetro , entonces .
También, tiene aproximadamente una distribución normal para valores de cuando es grande ( es suficiente). Por lo general, el valor de debe estimarse a partir de los datos disponibles y como , es natural usar la estimación (basada en ).
Por lo tanto, la carta tiene su línea central a una altura y sus límites de control están dados por:
Límite inferior de control =
Límite superior de control =
Para la aplicación de estos dos tipos de cartas de control para atributos, como se conoció el tamaño de la población para los meses de mayo a agosto de 2020 se tuvo que:
- k
- es el tamaño de la muestra;
- es el nivel de confianza;
- p
- es la variabilidad positiva;
- q
- es la variabilidad negativa;
- N
- es el tamaño de la población y
- E
- es la precisión o el error. 6
Entonces, a partir de la información ofrecida diariamente en https://t.me/MINSAPCuba, para los meses de mayo, junio, julio y agosto se tuvieron
subgrupos que aparecen en el anexo a este artículo, seleccionados mediante un muestreo simple aleatorio.
Resultados
A modo de ejemplo, la Figura 1 ilustra la carta adecuada a la muestra aleatoria de los días o subgrupos seleccionados entre los meses de mayo y agosto, en el análisis se obtuvo que y , asimismo el Límite superior de control fue y el Límite inferior de control . Por tanto, se observó que no todos los puntos estuvieron dentro de estos límites de control, por lo que el comportamiento del proceso (la dinámica diaria de transmisión de la COVID-19 en Cuba) no fue estable, ya que las proporciones de los tres primeros y de los 11 últimos subgrupos rebasaron el Límite superior; mientras que en los subgrupos del 41 al 73 las proporciones fueron menores que el Límite inferior.
De lo anterior se tuvo evidencia objetiva para afirmar que en la variabilidad y el comportamiento de la dinámica diaria de transmisión de la enfermedad de los tres primeros y de los 11 últimos subgrupos de la muestra se presentó alguna causa o situación especial que normalmente no estaba presente en este proceso y que lo empeoró de forma seria; mientras que en los subgrupos del 41 al 73 de la muestra ocurrió alguna causa que mejoró el desempeño de este proceso. Por tanto, se hace necesario localizar ambas causas, ya que así se estará en posibilidades de prevenir la primera, y en caso de no haber un error en el registro de los datos, fomentar la segunda.
La interpretación de los límites de control en la carta al observar la figura 1, facilitó que de cada 2651 personas obtenidas en el día para ser estudiadas, la proporción de casos positivos a la COVID-19 varió entre 0,00196 y 0,01144, con un promedio de 0,0067. Estos límites de control se interpretan en términos porcentuales de la siguiente manera: se espera que el porcentaje de casos positivos diarios a la enfermedad en Cuba varíe entre 0,196% y 1,144%, con un promedio de 0,67 por ciento.
Al realizar también un análisis más detallado en cada uno de los meses, tomados estos como conglomerados, en las cartas correspondientes a cada mes (mayo, junio, julio y agosto) se apreció que el comportamiento de la dinámica diaria de transmisión de la COVID-19 en Cuba tuvo cierta inestabilidad; ya que las proporciones de los subgrupos correspondientes a los días 01/5/20, 02/5/20, 03/5/20, 01/6/20, 06/6/20, 27/7/20, 28/7/20, 29/7/20, 08/8/20, 10/8/20 y 20/8/20 rebasaron el Límite superior de control.
En el mes de agosto, la línea central (la estimación de la probabilidad de que cualquier caso sea positivo a la enfermedad) rebasó la de los anteriores meses analizados y la de la muestra de 93 subgrupos. También se apreció que en este mes, esta línea central sobrepasó los límites superiores de control de los meses de junio y julio, y tuvo casi la misma altura que la muestra de 93 subgrupos.
De este estudio se ha derivado que la dinámica diaria de transmisión de la enfermedad en Cuba durante este periodo, estuvo en presencia de causas o situaciones especiales que por lo general no estaban presentes en dicho proceso y causaron que la proporción del número de casos positivos fuera anormalmente grande.
Al indagar lo ocurrido en los subgrupos se evidenció que: en los días 01/5/20, 02/5/20 y 03/5/20 la mayor cantidad de casos positivos (87,7%) fueron diagnosticados en La Habana, en un promedio de nueve municipios de dicha provincia, el resto de los casos estuvo distribuido entre las provincias de Matanzas, Villa Clara, Santi Spíritus, Ciego de Ávila, Holguín y Granma; en los días 01/6/20 y 06/6/20 la mayor cantidad de casos positivos (87,2%) fueron diagnosticados en La Habana, en un promedio de 10 municipios de la provincia, el resto de los casos estuvo distribuido entre las provincias de Matanzas, Granma y Guantánamo; en los días 27/7/20, 28/7/20 y 29/7/20 la mayor cantidad de casos positivos (90,3%) fueron diagnosticados en La Habana (48,4%) y Artemisa (41,9%), el resto de los casos estuvo distribuido entre las provincias de Santiago de Cuba y Guantánamo.
Por otra parte, en la carta obtenida de la muestra de 93 subgrupos (figura 2) también se observó que el comportamiento de la dinámica diaria de transmisión de la COVID-19 no se dio de manera estable, pues en la muestra de los últimos 11 días el número promedio de casos positivos a la enfermedad por muestra diaria sobrepasó el Límite superior de control. Además de estos puntos fuera del Límite superior de control existió otro patrón no aleatorio, pues en los días centrales a los 93 subgrupos el promedio de casos positivos fue menor que el Límite inferior de control.
De aquí que se tuvo evidencia para afirmar que en la dinámica diaria de transmisión de la enfermedad fue preciso identificar las causas que empeoraron la situación de los últimos 11 días para evitarlas, pues al parecer existió la desescalada de algunas medidas claves que se venían implementado en la práctica en los días centrales entre los cuatro meses estudiados.
La interpretación de los límites en la carta al observar la figura 2, provee que el valor esperado en las muestras de tamaños similares a las de la tabla 1 de este artículo se encuentre entre 6 y 30 casos confirmados a la COVID-19 con un promedio de 18 contagiados; cuestión que no ocurrió así desde los primeros días del mes de agosto, pues el comportamiento de la dinámica diaria de transmisión de la enfermedad en la mayoría de las veces rebasó la línea central (18 contagios como promedio) y el Límite superior de control (30 contagios como promedio).
Al realizar también la interpretación de los límites en la carta de la figura 3, el valor esperado en las muestras de tamaños similares a las del mes de agosto debió encontrarse entre 22 y 62 casos confirmados a la COVID-19 con un promedio de 46 contagiados; cuestión semejante a lo ocurrido en los últimos 11 días en la muestra de 93 subgrupos, pues en este mes de agosto el comportamiento de la dinámica diaria de transmisión de la enfermedad rebasó los 46 contagiados (la línea central) y en tres días rebasó los 62 contagios como promedio. En la figura 3 también se pudo observar que tanto el Límite inferior de control como la línea central rebasaron el Límite superior de control de la muestra de los 93 días en estos cuatro meses que fueron estudiados.
Discusión y conclusiones
La salud pública cubana se caracteriza por mantener un sistema de salud único, gratuito y universal, con tres niveles de atención y una alta vinculación con los diferentes sectores de la sociedad. Es por ello que cualquier evento epidemiológico pone en tensión a todos para controlarlo, desde el Gobierno del país hasta el último ciudadano. De ahí la importancia de los modelos de predicción y comportamiento de epidemias y eventos adversos, que permiten al Estado tomar decisiones con un fundamento científico.
Del grupo de modelos epidemiológicos estándar que se aplican a nivel internacional en situaciones de epidemia, Cuba ha utilizado en la COVID-19, entre otros que serán objeto de estudio en otras búsquedas temáticas, el modelo SIR y el número reproductivo R. 7
En estos modelos se parte del supuesto de que los individuos se encuentran en uno de varios estados posibles. En función de dichos estados, la población puede incluirse en: individuos susceptibles (S), infectados (I) y recuperados (R). El modelo SIR en su forma más simple puede formularse como un conjunto de ecuaciones diferenciales. 8
En el control de las epidemias también resulta esencial el número reproductivo básico . Este es el principal parámetro utilizado en epidemiología, definido como el número promedio de infecciones causadas por un individuo infectado cuando este es introducido a una población de susceptibles, e intenta capturar la capacidad reproductiva de la enfermedad.
Sin embargo, al existir la necesidad de que la transmisión diaria de la enfermedad sea estable, el no distinguir entre los dos tipos de variabilidad conduce a cometer errores en proceso. Error 1: reaccionar ante un cambio o variación como si proviniera de una causa especial, cuando en realidad surge de algo más profundo en el proceso, como son las causas comunes de variación. Error 2: tratar un efecto o cambio como si procediera de causas comunes de variación, cuando en realidad se debió a una causa especial.
Cada uno de estos dos errores proporciona pérdidas. Se puede evitar uno u otro, pero no ambos a la vez. Con este propósito, surge la necesaria aplicación de cartas de control estadístico al estudio del comportamiento y la variabilidad de la enfermedad en el tiempo.
En este trabajo se ha evidenciado, al aplicar las cartas de control para atributos, que el desempeño de la dinámica diaria de transmisión de la COVID-19 en Cuba se encontró algo distante de ser satisfactorio, pues el porcentaje promedio de casos positivos fue medianamente alto. Por ello, urge generar una propuesta de mejora (que evite la desescalada de medidas en las tres fases de la etapa post COVID-19) mediante la cual se encuentren las causas comunes más importantes que generaron la situación especial fuera de control.
La aplicación de las cartas de control también permitió dar evidencia objetiva para plantear que este comportamiento fue resultado del levantamiento o incumplimiento de medidas que se venían aplicando en meses anteriores para mejorar la dinámica diaria de transmisión, y que la existencia de la posibilidad medianamente alta de que este ciclo tenga cierta estabilidad o se encuentre bajo control estadístico dentro de dos meses es real, si se acometen las acciones integrales que lo permitan.
Este análisis de monitoreo de la dinámica diaria de transmisión de la enfermedad mediante cartas de control para atributos debe seguirse realizando de manera sistemática, al igual que un ulterior análisis de componentes principales categóricos de la encuesta epidemiológica; para evidentemente asegurar que las mejoras que se generen, para alcanzar la estabilidad epidemiológica, se conserven en el tiempo y así se puedan identificar y eliminar las causas especiales de variación en este proceso a la hora de acometer los encargos estatales (actividades sociales, económicas, reinicio del curso escolar, entre otros).
Día ( ) | Número de casos positivos a la enfermedad ( ) | Día ( ) | Número de casos positivos a la enfermedad ( ) | ||
---|---|---|---|---|---|
01-May-20 | 36 | 0,017 | 27-Jun-20 | 5 | 0,002 |
02-May-20 | 74 | 0,035 | 28-Jun-20 | 2 | 0,001 |
04-May-20 | 19 | 0,009 | 29-Jun-20 | 8 | 0,004 |
05-May-20 | 17 | 0,008 | 30-Jun-20 | 1 | 0 |
06-May-20 | 18 | 0,009 | 01-Jul-20 | 7 | 0,003 |
07-May-20 | 26 | 0,013 | 02-Jul-20 | 5 | 0,002 |
09-May-20 | 13 | 0,007 | 03-Jul-20 | 8 | 0,003 |
10-May-20 | 12 | 0,006 | 04-Jul-20 | 8 | 0,003 |
11-May-20 | 17 | 0,009 | 05-Jul-20 | 3 | 0,001 |
12-May-20 | 21 | 0,011 | 06-Jul-20 | 8 | 0,002 |
14-May-20 | 20 | 0,010 | 07-Jul-20 | 15 | 0,005 |
15-May-20 | 10 | 0,004 | 08-Jul-20 | 4 | 0,001 |
16-May-20 | 22 | 0,009 | 09-Jul-20 | 4 | 0,001 |
17-May-20 | 10 | 0,005 | 10-Jul-20 | 10 | 0,003 |
18-May-20 | 9 | 0,005 | 11-Jul-20 | 7 | 0,002 |
19-May-20 | 6 | 0,003 | 12-Jul-20 | 6 | 0,002 |
20-May-20 | 13 | 0,007 | 14-Jul-20 | 4 | 0,001 |
21-May-20 | 8 | 0,004 | 15-Jul-20 | 6 | 0,002 |
23-May-20 | 15 | 0,009 | 16-Jul-20 | 2 | 0,001 |
24-May-20 | 10 | 0,007 | 17-Jul-20 | 4 | 0,001 |
25-May-20 | 6 | 0,004 | 18-Jul-20 | 1 | 0 |
26-May-20 | 16 | 0,011 | 19-Jul-20 | 1 | 0 |
27-May-20 | 11 | 0,008 | 20-Jul-20 | 0 | 0 |
28-May-20 | 9 | 0,006 | 21-Jul-20 | 3 | 0,001 |
29-May-20 | 22 | 0,016 | 23-Jul-20 | 4 | 0,001 |
30-May-20 | 20 | 0,010 | 24-Jul-20 | 3 | 0,001 |
03-Jun-20 | 15 | 0,008 | 25-Jul-20 | 9 | 0,003 |
05-Jun-20 | 14 | 0,007 | 26-Jul-20 | 17 | 0,005 |
06-Jun-20 | 40 | 0,020 | 27-Jul-20 | 37 | 0,011 |
07-Jun-20 | 18 | 0,009 | 28-Jul-20 | 23 | 0,007 |
08-Jun-20 | 9 | 0,004 | 29-Jul-20 | 33 | 0,010 |
09-Jun-20 | 5 | 0,002 | 30-Jul-20 | 9 | 0,003 |
10-Jun-20 | 6 | 0,002 | 05-Aug-20 | 25 | 0,007 |
11-Jun-20 | 8 | 0,004 | 06-Aug-20 | 49 | 0,013 |
12-Jun-20 | 14 | 0,007 | 07-Aug-20 | 54 | 0,014 |
14-Jun-20 | 10 | 0,005 | 08-Aug-20 | 59 | 0,016 |
15-Jun-20 | 14 | 0,006 | 09-Aug-20 | 65 | 0,015 |
16-Jun-20 | 11 | 0,004 | 10-Aug-20 | 93 | 0,022 |
17-Jun-20 | 7 | 0,003 | 11-Aug-20 | 47 | 0,011 |
18-Jun-20 | 15 | 0,006 | 12-Aug-20 | 35 | 0,008 |
19-Jun-20 | 10 | 0,004 | 14-Aug-20 | 56 | 0,011 |
20-Jun-20 | 4 | 0,001 | 15-Aug-20 | 63 | 0,014 |
21-Jun-20 | 3 | 0,001 | 16-Aug-20 | 24 | 0,006 |
23-Jun-20 | 3 | 0,001 | 17-Aug-20 | 48 | 0,011 |
24-Jun-20 | 1 | 0 | 18-Aug-20 | 44 | 0,010 |
25-Jun-20 | 2 | 0,001 | 19-Aug-20 | 74 | 0,015 |
26-Jun-20 | 4 | 0,002 |
TFN1Fuente: Elaboración propia
1. | |
2. | |
3. | |
4. | |
5. | |
6. | |
7. | |
8. |
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional.