top of page
Buscar
  • Foto del escritorAdrian Lara

Análisis y Visualización de Datos

Actualizado: 22 mar 2022

Data Challenge 2022

El siguiente blog tiene como objetivo el análisis del conjunto de datos relacionado con el Proceso de Vacunación contra el Covid-19 en Ecuador, esta información se encuentra disponible en el Portal de Datos Abiertos https://datosabiertos.gob.ec.

Una imagen habla más que mil palabras, pero una simulación vale más que mil imágenes

Reto Calidad de Vida

El Reto Calidad de Vida, Data Challenge sugiere seleccionar información disponible acerca de temas relacionados con empleo, salud, tecnología, entre otros. El objetivo de este reto es responder interrogantes mediante el análisis y exploración del conjunto de datos seleccionados. En la actualidad, la información almacenada en la nube ha alcanzado niveles exorbitantes, y en este reto aprovecharé dicha información para responder a varias inquietudes adjuntas a la coyuntura actual generada por el proceso de Vacunación en Ecuador contra el COVID19.


Acerca de los Datos

El conjunto de datos seleccionados es el gestionado por el Ministerio de Salud Pública del Ecuador en el que registra el proceso de vacunación en el período Enero 2021 - Junio 2021, el banco de datos se encuentra disponible en el siguiente enlace MSP_VACUNA_COVID_2021.csv. Una breve descripción de la información y de los atributos que se encontrarán en este conjunto de datos se presenta en los cuadros a continuación.


DESCRIPCIÓN GENERAL

Institución

Ministerio de Salud Pública

Identificador

MSP-06-2021-V1

Documento de Referencia

MSP_Directorio_2021Junio

Nombre

Vacunas_ Covid_2021

Descripción

La base de datos de vacunas covid está compuesta del número de dosis aplicadas según tipo de vacuna, la misma contiene información del periodo 21 de enero al 30 de junio de 2021.

Licencia

CC-BY-4.0

Frecuencia de Actualización

Semestral

Lenguaje

Español

Etiquetas

Covid, vacunas, dosis aplicadas

ATRIBUTOS

Nombre del Campo

Descripción del Campo

fecha_vacuna

Fecha de aplicación de la vacuna

zona

Zona de ubicación del establecimiento de salud

provincia

Provincia de ubicación del establecimiento de salud

sexo

Sexo de la persona vacunada

gedad

Grupo de edad de la persona vacunada

nom_vacuna

Nombre de la vacuna aplicada

primera

Primera dosis aplicada por tipo de vacuna

segunda

Segunda dosis aplicada por tipo de vacuna

Objetivos del Análisis

El conjunto de datos seleccionados es en general bastante simple, y nos ayudará a visualizar los siguientes contextos:

Para el último objetivo será necesario una abstracción de la información para poder simplificar el mundo real a un entorno virtual, pues si una imagen dice más que mil palabras un simulación dice más que mil visualizaciones. Más adelante describiré con mayor atención el objetivo la simulación.


Visualización

Una previsualización de un extracto del conjunto de datos se presenta a continuación.


Las visualizaciones nos permiten comparar la tasa de asistencia en diferentes provincias, tanto en la primera dosis como en la segunda dosis, además se puede complementar la información agrupando esta información por sexo, grupo de edad, zona de salud, entre otros.

El procesamiento de la información y visualización de los diferentes enfoques fueron realizados en la herramienta Notebook de Jupyter.


Puedes encontrar un documento mas a detalle del procesamiento de la información y la visualización de los datos, en el siguiente enlace data_covid.ipynb

 

Sistemas Complejos

En el siguiente apartado describiré conceptos para entender uno de los objetivos más importantes del análisis de este conjunto de datos. Python y sus librerías de análisis de datos nos muestran un análisis bastante completo de la información recopilada, a continuación describiré un no tan conocido lenguaje dedicado a la Simulación de Sistemas Complejos que nos permitirá sacar aún más provecho de la información que se encuentra en la nube.


Simulación Computacional

La simulación se puede definir como la imitación de ciertos aspectos sobresalientes de un sistema en estudio, con el objetivo de predecir y describir comportamientos . Se define la simulación computacional (SC) como una alternativa metodológica que permite, a través de herramientas informáticas, imitar procesos o sistemas del mundo real con el objetivo de explicar y analizar conductas.

NetLogo es un entorno de modelado programable multiagente. Es utilizado por muchos cientos de miles de estudiantes, profesores e investigadores en todo el mundo. También potencia las simulaciones participativas de HubNet.

Sistema Multiagente

Un sistema multiagente es un sistema compuesto por múltiples agentes inteligentes que interactúan entre ellos. Los sistemas multiagente pueden ser utilizados para resolver problemas que son difíciles o imposibles de resolver para un agente individual o un sistema monolítico.


El Modelo Computacional Vacunación-Covid

Una vez definido el contexto de lo que podemos hacer con un modelo de simulación computacional, el paso a seguir es abstraer la información acerca del proceso de vacunación de la primera parte de este blog y convertirlo en un sistema multiagente. De esta forma podemos visualizar de mejor manera ciertos aspectos ya representados en la galería de imágenes con un enfoque distinto.


La abstracción de la información debe ser lo más fiel posible a la realidad. Por ejemplo, en el modelo computacional sería algo complejo (computacionalmente hablando) representar las 233 764 filas de información que contiene el conjunto de datos objeto de estudio de este challenge. Por lo que, debemos seleccionar una forma adecuada de simplificar el porcentaje de la población con la que vamos a trabajar.


NetLogo es un lenguaje de programación simple y adaptado al modelado/simulación de fenómenos en los que aparecen muchos individuos (agentes) interactuando, por ejemplo, en los fenómenos habituales que se dan en la naturaleza, las sociedades, o muchas áreas de las ciencias. Netlogo nos permite trabajar con dos tipos de agentes:

  • Tortugas: agentes móviles, nos ayudarán representar las personas vacunadas y no vacunadas.

  • Patches: agentes no móviles, nos ayudarán a representar el espacio geográfico.


Netlogo
Interfaz del Modelo Computacional

El modelo computacional consta de una interfaz gráfica que nos permite realizar las siguientes acciones:

  • Cargar la información de un archivo .csv (la información debe ser previamente procesada para que el programa pueda reconocer los valores).

  • Seleccionar si la visualización de información es según la primera o segunda dosis de vacunación.

  • Configurar las condiciones iniciales previo a empezar la simulación.

  • Configurar un mundo con dos opciones: vacunados y no vacunados.

El último ítem configurable nos permitirá analizar y responder ciertas interrogantes, como por ejemplo:

  • Que tan rápido se propaga el COVID con la aplicación de la primera dosis.

  • Cuán efectivas son las vacunas si se aplica a un gran porcentaje de la población.

  • Entre otras cuestiones que pueden ser analizadas en trabajos futuros.

La visualización de la información no solo es más interactiva, sino más efectiva. Además gracias a la simulación podemos realizar estimaciones y brindar soluciones dependiendo los problemas que podamos abstraer del sistema a representar en cuestión. Ahora observemos como se generan visualizaciones de nuestra información en el mundo de Netlogo.

Podemos configurar una población con ausentismo en el proceso de vacunación, y comparar la tasa de contagio versus una población con un alto índice de vacunación. A continuación un ejemplo de una simulación básica.



Si bien es una simulación bastante sencilla, Netlogo nos permite responder este tipo de interrogantes para plantear soluciones y evaluar escenarios que en la vida real serían sino imposibles, casi imposibles de evaluar antes de tener un diagnóstico de una determinado problema.


Consideraciones

Debo mencionar que la abstracción del modelo ha sido bastante empírica, de cierto modo un modelo completo requiere incluso de un equipo interdisciplinario para poder extraer los detalles y aspectos más importantes de un sistema complejo. Se deben considerar todas las variables posibles a fin de que las simulaciones sean lo más fieles a la realidad posible. Para posibles trabajos futuros se puede complementar las simulaciones con datos acerca de la efectividad de cada vacuna, y contrastar con información real de cuan efectivo ha sido el proceso.


Puedes descargar el modelo computacional dando clic en el siguiente enlace. Basta con Instalar Netlogo en tu ordenador para interactuar con la información disponible en el modelo. Si tienes dudas al respecto no dudes en contactarme, o si necesitas ayuda para adentrarte en el mundo de Netlogo.






bottom of page