Los países se enfrentan continuamente a situaciones políticas, económicas, sociales y eventos naturales que afectan los niveles y las condiciones de pobreza en su población. Las necesidades de asistencia social son cambiantes, y en muchos casos se exacerban en el corto plazo. Estas nuevas necesidades de poblaciones vulnerables no se reflejan automáticamente en los censos que utilizan los gobiernos para diseñar programas sociales, ya que dicha información se obtiene y actualiza cada 10 años.
Los gobiernos se encuentran frente al desafío de contar con datos más actualizados al momento de la toma de decisiones. En el caso de México, la ex Secretaría de Desarrollo Social –SEDESOL– (ahora Secretaría de Bienestar) contaba con una plataforma en donde se integraba información contextual de los estados y municipios para la toma de decisiones de programas sociales, se consolidaba información basada de censos (Instituto Nacional de Estadística y Geografía, INEGI) y encuestas estatales realizadas cada cinco años (Encuesta Nacional de Ingreso y Gastos de Hogares, ENIGH) pero también se integraba información de registros administrativos, encuestas levantadas por la propia secretaría. Así como información de indicadores de amenazas antropogénicas e hidrometeorológicas publicadas por otras instituciones de gobierno (Cenapred, Conagua, Semarnat, etc.).
El proyecto, con el apoyo del BID, se centró en generar un sistema automatizado que permitiera actualizar los datos de la plataforma y crear perfiles municipales de México. De esta manera, los funcionarios contaron con datos que describían de una forma más integral las vulnerabilidades, capacidades y amenazas de cada uno de los 2465 municipios de las 32 entidades federativas.
El big data como herramienta para targeting de planes sociales
El Laboratorio de Ciencia de Datos de la Dirección General de Geoestadística y Padrones de los Beneficiarios (DGGPB) de la ex Secretaría de Desarrollo Social, en colaboración con instituciones públicas, sociedad civil y entidades académicas, desarrolló una plataforma preventiva que sirviera como herramienta para los funcionarios públicos en la toma de decisiones en materia de programas sociales de asistencia (ver Figura 1). Dicha plataforma integraba información proveniente de censos, encuestas estatales y el Cuestionario Único de Información Socioeconómica (CUIS) de la SEDESOL, y permitía alimentar el Mapa Nacional de Carencias (MANAC).
Figura 1: Captura del portal web de la plataforma preventiva
El MANAC es un mapa de alcance nacional con información desagregada a nivel municipal, que mediante una metodología de estimación de áreas pequeñas actualiza las condiciones de vulnerabilidades y marginación de la población a nivel municipal para poder contribuir al desarrollo de un sistema de protección social adaptativo considerando amenazas y vulnerabilidades de la población.
También se trabajó en el mejoramiento de la calidad de los datos de las encuestas que forman parte del MANAC. La importancia de tener datos precisos respecto a las necesidades de la población es una de las claves para garantizar el éxito de los programas sociales. Con ello se busca identificar claramente quiénes reúnen las condiciones de elegibilidad de los distintos planes sociales, y de esta manera asegurar que la asistencia llegue con un criterio de eficiencia a sus verdaderos destinatarios.
Para ello, en el 2018 se realizó un levantamiento piloto en el Municipio de San Blas de Oaxaca, donde durante el encuestamiento del CUIS se aplicó un modelo de machine learning en tiempo real para estimar la probabilidad de sobre y sub reportaje para encuestas socioeconómicas autorreportadas, para que, en caso de ser necesario, el encuestador pudiera realizar una verificación domiciliaria para poder obtener datos de mejor calidad con los que tomar decisiones de focalización.
Los equipos, formados por tres encuestadores, un supervisor y el apoyo de traductores, realizaron 532 encuestas. Como resultado adicional del piloto, que se realizó en el municipio de San Blas Atempa en Oaxaca, se pudieron actualizar las mediciones de carencia multidimensional que se vieron afectadas de forma importante después del sismo del 19 de septiembre de 2017.
¿Qué aporte nos dejó el big data?
- Big data y machine learning se convierten en herramientas claves para poder contribuir con la identificación correcta de la población potencial a programas de desarrollo social; con estas metodologías se busca garantizar que los recursos lleguen a las poblaciones necesitadas, reduciendo con ello los errores de exclusión.
¿Cuál fue la clave para alcanzar el éxito en el proyecto?
- El trabajo en coordinación con las autoridades estatales y municipales garantizó que el proyecto piloto fuera realizado con éxito y se pudiera acceder a los hogares a encuestar.
- La disponibilidad de los datos de los censos, encuestas y demás fuentes en formato digitalizado facilitó la integración en la plataforma y permitió el desarrollo de modelos predictivos a ser utilizados a nivel nacional.
¿Qué aporte nos dejó el big data?
- Big data y machine learning se convierten en herramientas claves para poder contribuir con la identificación correcta de la población potencial a programas de desarrollo social; con estas metodologías se busca garantizar que los recursos lleguen a las poblaciones necesitadas, reduciendo con ello los errores de exclusión.
¿Cuál fue la clave para alcanzar el éxito en el proyecto?
- El trabajo en coordinación con las autoridades estatales y municipales garantizó que el proyecto piloto fuera realizado con éxito y se pudiera acceder a los hogares a encuestar.
- La disponibilidad de los datos de los censos, encuestas y demás fuentes en formato digitalizado facilitó la integración en la plataforma y permitió el desarrollo de modelos predictivos a ser utilizados a nivel nacional.