(Actividad) Data mining en los medios

Ejemplo 1: http://www.elconfidencial.com/tecnologia/2016-10-23/los-humos-ahogan-el-dia-del-cambio-climatico-en-espana_1279024/

En el siguiente ejemplo se muestra el aumento de las emisiones de dióxido de carbono en España y la región que más contaminada. Los datos han sido obtenidos del Registro Estatal de Emisiones y Fuentes Contaminantes y el artículo presenta varios gráficos con los resultados de las emisiones de dióxido de carbono en el espacio (en las diferentes comunidades autónomas de España) y en el tiempo (a lo largo de los años).

Lo primero que vemos es un mapa interactivo realizado con CARTO. Los gráficos en los que se ilustra la evolución de las emisiones en el tiempo está realizado con Datawraper y se ha basado en datos del Observatorio de Sostenibilidad.

Mapa de contaminación mostrado en el artículo

Mapa de contaminación mostrado en el artículo

Gráfico que muestra la evolución de las emisiones en la última década

Gráfico que muestra la evolución de las emisiones en la última década

En este caso la labor de minería es esencial para obtener el resultado de las emisiones de cada región así como para obtener la conclusión de cuál es la más contaminada. Es muy interesante la aplicación de los datos en el tiempo para que el lector pueda comparar y también que elaboren el contrapunto del artículo, mostrando las comunidades que han reducido las emisiones.

Aunque no esté familiarizada con las herramientas de extracción de datos que se utilizan en este ejemplo, la presentación de los datos creo que es correcta para que el lector tenga muy clara la información. Su resultado es muy limpio.

Ejemplo 2: http://www.lavanguardia.com/vangdata/20150520/54431756037/los-100-nombres-de-hombre-y-mujer-mas-frecuentes-en-espana.html

En el siguiente ejemplo se exponen los nombres más frecuentes utilizados en España para ambos sexos. Los datos han sido obtenidos del Instituto Nacional de Estadística pero no conocemos el software con el que han realizado los gráficos porque no aparece junto a ellos. Algo que me ha parecido interesante es que el lector pueda descargarse los datos brutos en formato CSV desde el propio artículo.

Parte del gráfico que ilustra los nombres de mujer más frecuentes.

Parte del gráfico que ilustra los nombres de mujer más frecuentes.

Es un artículo de elaboración sencilla, ya que la labor de minería ha sido la obtención de los datos del Instituto Nacional de Estadística y su tratamiento en Excel. Podría haber sido interesante mostrar una evolución de esos nombres a lo largo del tiempo, es decir, mostrando los que eran más frecuentes hace algunas décadas para ver cómo ha evolucionado la moda, por ejemplo.

En cuanto a la herramienta utilizada para la extracción de los datos, no creo que haya que cambiar de software porque se trata de un caso sencillo. Parece que el gráfico, posiblemente elaborado con Excel, ha podido importarse en la plataforma de publicación de noticias del medio. Como único inconveniente, creo que puede aprovecharse mejor la información para mostrarle al lector otra perspectiva periodística de los datos.

Be Sociable, Share!