Metadatos: sacando agua de las piedras

En el periodismo de investigación, la búsqueda de los datos es la piedra angular del trabajo. Existen numerosos métodos para encontrar estos datos: desde la simple consulta o petición hasta la elaboración de los mismos, pasando por la recogida de páginas públicas como el Instituto Nacional de Estadística.

Sin embargo, a veces es necesario ir más allá, averiguar el origen, el formato, el programa con el que se han realizado, etc. Y para ello existen los datos que definen a los propios datos: los metadatos. Vamos a analizar tres tipos de archivo de los que podemos extraer metadatos.

De texto

Son los archivos más comunes y los que menos evolución han sufrido, quizás por tratarse de la esencia misma de la comunicación. Con el programa PdfMetadata podemos extraer información relevante sobre los extendidos archivos PDF como creador, programa del que provienen, cómo se han convertido a PDF, etc.

Extracción de metadatos con PdfMetadata

Extracción de metadatos con PdfMetadata

Conocer estos metadatos puede ser útil para verificar la autoría, detectar errores (tipo de texto ANSI, por ejemplo), conocer la fecha de creación o el tiempo invertido creando el archivo.

De imagen

Estos archivos contienen bastante información oculta que se archiva automáticamente al tomar la foto o al editarla. Con el programa GeoSetter podemos encontrar todo tipo de información (cientos de datos) además de los EXIF asociados a toda imagen.

Extracción de metadatos con GeoSetter

Extracción de metadatos con GeoSetter

La información, sobre todo, se asocia al dispositivo con el que se toma la foto, aunque tiene la posibilidad de asociar coordenadas geográficas y podemos crear un mapa de fotos con esta aplicación. Periodísticamente puede ser relevante para confirmar que la imagen no se ha alterado, que se han tomado una serie de fotos con la misma cámara, en la misma ubicación, en las mismas condiciones, etc. Por lo demás, aporta información sobre tratamiento de color, exposición y demás datos técnicos.

Multimedia

Quizás es el formato que más ha cambiado y que posiblemente más cambiará, ya que los estándares, aunque se intenten imponer desde las empresas de tecnología, los suelen marcar la comunidad de internet. Con la utilidad on line Metadata2go, podemos subir archivos de los que se extraerán sus metadatos.

Extracción de metadatos con Metadata2go

Extracción de metadatos con Metadata2go

Esto puede ser útil para archivos relativamente pequeños, aunque la información de audio, más allá de los datos técnicos, no es muy informativa. Para archivos más grandes existe VLC, que es el reproductor multimedia más descargado del mundo, que ofrece muchísimas utilidades apenas conocidas, entre ellas la visualización de metadatos.

Extracción de metadatos con VLC

Extracción de metadatos con VLC

La multitud de códecs, muestreos, resoluciones y demás datos técnicos, pueden resultar útiles para clasificar archivos multimedia y extraer información sobre compresores de imagen, audio, etc.

Be Sociable, Share!