¿Debe un Periodista de Datos Familiarizarse con la Línea de Comandos?

Solemos usar el ratón de nuestro ordenador para hacer clic en íconos de programas y acceder a todos nuestros archivos, programas, y carpetas. Mediante esos actos, comunicamos con nuestro ordenador, indicándole que acciones debe completar. No obstante, no necesariamente es la manera más eficiente de comunicarnos con nuestro ordenador. Otra manera de dar instrucciones a nuestro equipo es mediante es uso de la línea de comandos, una interfaz rápida que se basa en texto y que por lo tanto no cuenta con un GUI.

Photo by Goran Ivos on Unsplash

Photo by Goran Ivos on Unsplash

La línea de comandas ofrece una serie de ventajas que hace que sea una herramienta potente para cualquier persona. Para el periodista de datos es imprescindible, teniendo en cuenta que suelen dedicar mucho tiempo a limpiar, analizar, y revisar conjuntos de datos. Más allá de los comandas básicas la línea de comandas permite escribir scripts para automatizar tareas repetitivas y  bajar herramientas de código abierto que se implementan directamente dentro de la terminal como por ejemplo Instaloader, youtube-dl o csvkit. Istaloader permite hacer un scraping de los perfiles de Instagram, captando así no sólo imágenes sino también hashtags, historias, feeds y todos los metadatos. Youtube-dl por otro lado, permite bajar vídeos de casi cualquier web. Csvkit quizás es la herramienta más común, ya que ofrece un abanico de comandas que facilite el trabajo con ficheros CSV.

Utilizando la línea de comandos a través del terminal se puede, por lo tanto, acceder a ficheros de datos de texto de tipo .csv o .txt para así sacar conclusiones relevantes. Es cierto que esto se puede hacer también mediante un programa como Excel, que debido a su interfaz gráfica a primera vista parece más fácil de manejar. No obstante, cuando trabajamos con ficheros grandes en la que tenemos muchas columnas y filas, el proceso se hará con mucha más rapidez y agilidad mediante la línea de comandas.

Ejemplo del uso de la línea de comandos para visualizar rápidamente un fichero muy grande.

Ejemplo del uso de la línea de comandos para visualizar rápidamente un fichero muy grande.

Cuando tratamos de analizar textos, algunas comandas de uso frecuente son los siguientes:

  • head”: Permite a visualizar las primeras líneas de un fichero.
  • grep”: Ayuda a buscar una palabra o conjunto de caracteres en uno o varios ficheros. Es una comanda muy utilizado con mucha potencial debido a la potencial combinación con expresiones regulares.
  • sed”: Permite realizar reemplazamientos en archivos de texto.

La línea de Comanda también permite averiguar más información en cuanto a los dominios en la web. Esta técnica fue empleada por The Financial Times cuando descubrieron que el nombre del sospechoso por el asesinato del primer ministro británico Jo Cox fue mencionado en un sitio web neonazi. A parte de la URL de la web no tenían más información, por lo que recurrieron a la comanda “whois” y “grep” para descubrir quién registró la página para así poder obtener un número de teléfono de contacto para seguir con la investigación del asesinato.

Ejemplo comanda "whois nyt.com".

Ejemplo comanda “whois nyt.com”.

Debido a la gran variedad de acciones que se pueden emplear a través de la terminal de cualquier ordenador, tanto mediante comandas simples, como scripts, y tools de código abierto, la línea de comanda es una herramienta de gran valor para cualquier persona que en su día a día maneja una gran cantidad de datos estructurados o no estructurados y que se podría beneficiar de técnicas que mejoren la experiencia de uso durante el proceso de data-mining. A pesar de que a primera vista la herramienta puede parecer poco amigable en comparación con software con un interfaz gráfico, las comandas simples son fáciles de ejecutar y los beneficios infinitos.

 

Bibliografia:

Corcho, O. (2014, April 25). ¿Puede un periodista usar la línea de comandos? #JPD14 · Localidata. Retrieved May 24, 2020, from Localidata website: https://www.localidata.com/puede-un-periodista-usar-la-linea-de-comandos-jpd14/

Keller, C. (2020, April 5). chrislkeller/nicar15-command-line-basics. Retrieved May 24, 2020, from GitHub website: https://github.com/chrislkeller/nicar15-command-line-basics

Lai, K. R. (2013, November 27). MozFest 2013: Journalists should command the command line. Retrieved from Northwestern University Knight Lab website: https://knightlab.northwestern.edu/2013/10/27/mozfest-2013-journalists-should-command-the-command-line/

Meers, J. (2019, September 29). Getting Stories from the Command Line. Retrieved May 24, 2020, from Global Investigative Journalism Conference 2019 website: https://gijc2019.org/2019/09/29/getting-stories-from-the-command-line/

Vicens, A. J. (2020, March 7). AJVicens/command-line-for-reporters. Retrieved May 24, 2020, from GitHub website: https://github.com/AJVicens/command-line-for-reporters