PONENCIA 286 | La utilización de aprendizaje automático en ciencias sociales y los resguardos metodológicos necesarios. Cuestionamientos a partir de la imputación de ingresos en la EPH

Luis Nahuel Fernandez, Licenciado en sociología (UBA).

La corrección de la no respuesta parcial es una de las grandes problemáticas de las encuestas de hogares. La corrección de la misma es una tarea necesaria para garantizar la representatividad de la muestra y la calidad de las estimaciones.
A partir del gran desarrollo de las ciencias computacionales, en las últimas décadas comenzaron a estar disponibles los algoritmos de aprendizaje automático como herramientas para la imputación de la no respuesta parcial que están siendo estudiadas y puestas a prueba en el campo de la investigación social. Está demostrado en diversos estudios que en términos de error cuadrático medio, o error medio absoluto estos mecanismos tienen un rendimiento superior a las técnicas tradicionales.
En el presente trabajo se buscará comparar el rendimiento de hot deck que es una técnica estadística “tradicional” utilizada desde hace décadas con este fin, árboles aleatorios como un ejemplo de ensambles más “novedosos” y regresión lineal múltiple robusta como un tercer ejemplo de control. Pero con ellos se buscará ir más allá de las métricas utilizadas en ciencia de datos y evaluar qué impacto tienen en la elaboración de estadísticas sociales. ¿Alcanza con el ECM y el MAE en cs. sociales?. El ejemplo desde el cual se abordará la cuestión es qué sucede con la distribución del ingreso y el coeficiente de Gini.

Ver ponencia completa


Cómo llegar



Sedes

Sede SE | Santiago del Estero 1029
CABA – Argentina | Tel +54 (11) 5287-1500

Sede MT | Marcelo T. de Alvear 2230
CABA – Argentina | Tel +54 (11) 5287-1500


Seguinos