El big data en la salud: mejorando estrategias para la enfermedad crónica
La enfermedad renal crónica (ERC) es un problema de salud pública mundial. Una de cada 10 personas en el mundo la padecen y sus causas son complejas de determinar ya que incluye enfermedades comunes como por ejemplo la hipertensión arterial (HTA), la diabetes mellitus y obstrucciones en las vías urinarias. Los pacientes con ERC suelen ver afectada su calidad de vida y su bienestar económico; debido a que la ERC se manifiesta en un estado avanzado, el paciente debe recibir tratamientos más complejos y costosos, generando un impacto económico y social en los sistemas de salud. Es por ello que el diagnóstico y tratamiento precoz de la enfermedad es fundamental, ya que por un lado puede prevenir o retrasar el avance de la enfermedad y reducir las complicaciones de riesgo de salud del paciente, y por otro lado puede disminuir los altos costos asociados con el tratamiento, permitiendo asignar los recursos del sistema de salud de forma más eficiente.
En el 2008 el Fondo Colombiano de Enfermedades de Alto Costo incorporó a la ERC como patología de alto costo, y desde entonces la Cuenta de Alto Costo (CAC) se encarga de recabar información sobre la evolución de esta enfermedad en el país y ayudar formular políticas públicas de salud ‹https://cuentadealtocosto.org/site/erc/›. La disponibilidad de datos generó el espacio propicio para una iniciativa conjunta entre la CAC y el Departamento Nacional de Planeación pare el uso de big data en el análisis de los datos relacionados con atención a pacientes del sistema de salud. El objetivo principal de esta iniciativa fue identificar los principales factores de riesgo y generar instrumentos con capacidad predictiva en la aparición y progresión de la enfermedad en el país.
El big data como gran herramienta para el análisis de datos y la comprensión de los fenómenos sociales
La CAC posee datos desde el 2008 sobre los pacientes con HTA, Diabetes y ERC; no obstante, el primer gran desafío fue poder integrarla. La información de cada año se almacenaba en una base de datos, por lo cual el estudio predictivo focalizado para los años 2013 a 2017 tuvo que integrar cinco bases de datos diferentes con más de cien variables cada una. Una vez integrados los datos de las diversas bases, el equipo trabajó en los modelos predictivos respecto a las características de la patología y evolución de la enfermedad, utilizando lenguaje R y Python. Los modelos fueron diseñados para ser ejecutados de forma sistemática, y se puedan ejecutar de forma automática cada vez que ingresen datos nuevos al sistema.
El análisis descriptivo de las bases de datos permite identificar la cantidad de pacientes que padecen ERC y cruzar la información con otras enfermedades comunes, como la hipertensión arterial y diabetes mellitus. El análisis descriptivo permitió comprobar que la primera causa de la ERC estuvo asociada con dichas enfermedades. Para el 2017, el 21% de los pacientes de la enfermedad renal crónica se encuentran en estadio 1, el 27% en estadio 2, el 44% en estadio 3 y el 7% en las últimas dos fases terminales de la enfermedad (Quantil 2018, Revisión de Literatura, página 11). Uno de los hallazgos fue que con el correr de los años la proporción de pacientes fallecidos que fueron diagnosticados con ERC fue creciendo sostenidamente desde 1.26% en el 2014 hasta 3.28% (Quantil 2018, Revisión de Literatura, página 12). Para el 2017, la causa de muerte más común entre los pacientes diagnosticados con ERC fue la enfermedad renal (22.9%), y en segundo lugar la enfermedad cardiovascular (10.1%) (Quantil 2018, Revisión de Literatura, página 13). Junto con los modelos descriptivos de análisis de datos se realizaron análisis predictivos y espaciales que aportan información relevante para el sistema de salud nacional.
El uso de big data permite la utilización de herramientas de visualización de la información que tiene gran impacto. Por ejemplo, en el caso de ERC, la Figura 1.a y 1.b muestra la distribución geográfica de los pacientes con ERC en etapa 5 de la enfermedad para el 2014 y 2017. La variación geográfica en la densidad de pacientes con la patología en estadio 5 permite identificar claramente cuáles son las delegaciones con mayores necesidades de recursos para afrontar la situación.
Fuente: Quantil, Matemáticas aplicadas (2018) p. 25.
¿Qué aporte nos dejó el big data?
¿Cuál fue la clave para alcanzar el éxito en el proyecto?
- Gobernanza de los datos. Las instituciones que están encargadas de recopilar la información jugaron un papel clave en el proyecto y fueron fundamentales para alcanzar el éxito. El alto control de calidad de los datos, la confiabilidad de la información que recopilan y la provisión de datos completos y validados permitieron generar base de datos con información confiable y de calidad.
- La anonimización de los datos de los pacientes realizada por la CAC garantizó estándares altos de protección de datos sensibles y de la privacidad de los pacientes. La entidad se encargó de poner sus bases de datos en los servidores de forma ya anonimizada antes de ejecutar los procesos analíticos, con lo cual no existió riesgo de violación a la privacidad.