Data mining en los medios

Guía para entender los Presupuestos Generales del Estado

Este ejemplo, fue extraído de diario  elmundo

(http://www.elmundo.es/economia/2017/04/04/58e3793222601deb7e8b461f.html), es un reportaje del  4 de abril de 2017, en el cual  se  realiza una guía a través de gráficos para entender el Presupuesto General del Estado.

Para el ejemplo práctico considere un reportaje del diario el mundo sobre las Principales Partidas de Presupuestos 2017

Esta es una forma de ofrecer a los lectores información numérica sobre el presupuesto general del estado español de forma más sencilla. La fuente donde se tomaron los datos es de la Secretaría de Estado de Presupuestos y Gastos. En el portal los datos  se encuentran en una carpeta comprimida Zip, una vez extraída, los datos están en CSV dada la utilidad de los formatos ofrecidos es más sencillo, sin embargo el trabajo es arduo debido a la cantidad de datos que se debe analizar para realizar los gráficos estadísticos con la información para que sea entendible para los lectores.

http://www.pap.minhafp.gob.es

http://www.sepg.pap.minhafp.gob.es/sitios/sepg/es-ES/Presupuestos/PGE2017Prorroga/Paginas/PGE2017Prorroga.aspx

Adicional a ello existen datos tomados del Libro Amarillo , donde se desmenuzan todas las cifras, de lo más destacado del presupuesto 2017.

Realizada esta investigación la data se agrupó por año y tipo de presupuesto:

  • Cotizaciones sociales
  • Iva
  • Pensiones
  • Intereses en deudas
  • Desempleo
  • Servicio Público Básico
  • Otros Gastos, etc.

La base de la investigación surgió a partir de la información oficial de la Secretaría de Estado de Presupuestos y Gastos, misma que fue analizada en Excel y también visualizada en el software de Tableau Public. La recopilación de información en PDF fue automatizada y convertida a archivos de Excel y base de datos mediante un recopilador de información automatizado.

Para la investigación El Mundo usó VBasic para aplicaciones de Excel Macros y Tableau Public.

España crea ya el 60% del empleo femenino temporal de toda la Unión Europea

España lidera la precariedad de las mujeres en el empleo

10/01/2018

Este ejemplo, fue extraído de diario El Confidencial

Para la creación del gráfico utilizaron la herramienta Datawrapper

 https://app.datawrapper.de/_/jUpst

Esta exposición sobre los los datos de la  evolución del paro, del número de mujeres temporales en un año, hasta el cierre del primer semestre de 2017, se ha extraído los datoshttps://www.sepe.es/contenidos/que_es_el_sepe/estadisticas/datos_avance/datos/index.html donde se encuentra la información detallada mes a mes y por año en archivo PDF y XLS, es importante indicar  que la extensión XLS corresponde al formato de archivo de Microsoft Excel. La extensión XLS se utilizó hasta la versión 2007. Es importante puntualizar que el periodista al encontrarse con esta versión le ha tocado invertir un par de horas en la limpieza y reestructuración de los datos.

La principal fuente de información para corroborar los datos es http://www.empleo.gob.es, en esta web los datos se encuentran en archivo PDF por lo que considero utilizaron Tabula para la extracción a formato Excel.

 

Be Sociable, Share!