Data mining en los medios

En México, como en la mayoría de países, las mujeres no tienen las mismas oportunidades ni ganan lo mismo que los hombres. Sobre esta premisa, el diario El Universal presenta un informe de la unidad de Periodismo de Datos en el que expone estas y otras brechas[1].

Las cifras del reportaje (incluye video, texto e infografía) tienen como fuente la Encuesta Nacional de Ocupación y Empleo del Instituto Nacional de Estadística y Geografía[2].

El primer indicio, al parecer, viene de un comunicado de prensa de la entidad. Se infiere que a partir de esa información se buscaron los consolidados de las encuestas que muestran el panorama laboral en México. Los resultados[3] despliegan variables y filtros, según lo que se quiera consultar:

Inegi

Al hacer la consulta arroja una tabla con los resultados:

Inegi 2

La página da la opción de exportar la tabla a Excel, pero no es necesario pasar por un software OCR, pues filas y columnas guardan estricto orden conforme la página web. Es una extracción sencilla.

El tema de los ingresos económicos siempre será una fuente inagotable en el periodismo de datos. Miguel Ángel Bastenier, periodista español, ha reiterado en diversos escenarios que toda nota periodística ha de cumplir la regla de las tres D: “Dinero, drama y diversión”[4].

Estos reportajes como el ejemplo anterior están entre las notas más leídas. Igual sucedió con la denuncia hecha por La Nación, diario de Costa Rica en la que advertían que el Poder Judicial aumentó en 72.500 millones de colones (unos 126 millones de euros) los incentivos salariales de los funcionarios. El aumento significa un 148%, según un gráfico interactivo publicado en su edición digital.

la nacion

Al final del informe, se presentan las tablas en Excel que sirvieron de fuente. Al analizarlas se percibe que fueron extraídas de documentos pdf nativos previa solicitud del medio de comunicación.  El archivo muestra que se condensaron y filtraron  más de 200.000 registros. Sin embargo, las tablas no ofrecen una interacción con el lector y son difíciles de interpretar. Si los reporteros se tomaron el trabajo de organizar esos datos hubiera sido un plus para el internauta mostrar los datos con otro gráfico interactivo y no solo columnas y filas interminables.

tabla1tabla2

 

 

 

 

 

 

 

 

La ñapa

Gasto militar mundial aumentó casi 14.000 millones de dólares en 2015 es un trabajo de la Unidad de Datos del diario El Tiempo que incluyó un video con la herramienta VideoScribe, tablas interactivas y un amplio reportaje[5]. Se basó en un informe del Instituto Internacional de Estudios para la Paz de Estocolmo que explicaba la carrera armamentista en el mundo.

El portal ofrece visualización en la web o exportación a una tabla Excel.

Sipri

Sin embargo, el formato Excel lo convierte en un formato CSV por lo que hay que es necesario realizar el procedimiento de importación de datos.

excel sipri

 

[1] http://www.eluniversal.com.mx/articulo/periodismo-de-datos/2016/03/6/salarios-de-mujeres-con-rezago-de-10-anos

[2] http://www.inegi.org.mx/

[3] www.beta.inegi.org.mx/proyectos/enchogares/regulares/enoe/

[4] “El periodismo es uno solo”. Relatoría del seminario taller ‘Periodismo y cultura’ con Miguel Ángel Bastenier Recuperado de http://www.fnpi.org/periodismoycultura/recursos/relatorias/relatoria-miguel-angel-bastenier/

[5] http://www.eltiempo.com/multimedia/especiales/cual-es-el-gasto-militar-en-el-mundo/16740738/1

Be Sociable, Share!