Todo habla. No es necesario escribir el nombre ni aparecer en las fotos que subimos a internet para que alguien conozca nuestros gustos, edad, orientación política y hasta el estado de ánimo de nuestros grupos y amigos. Un estudio acaba de mostrar que esa información oculta importa más que un rostro

El Deber logo
2 de septiembre de 2018, 4:00 AM
2 de septiembre de 2018, 4:00 AM

Cuando subimos una foto a internet, los píxeles son los datos; cuando subimos un texto, los datos son los bits que contiene el archivo. Pero hay otra información que son los metadatos. Nunca pensamos en ellos, a pesar de que muestran más de lo que quisiéramos. El especialista en informática forense Israel Rosales dice que “los metadatos son los datos de los datos”.

Por ejemplo, cuando el trabajador de una empresa pone información en la web, se puede revisar quién creó el documento, qué día y a qué hora lo hizo y hasta se puede saber el nombre de la computadora utilizada. “Se puede saber qué sistema operativo fue utilizado. Si se trata de una empresa, es posible ver el nombre del dominio de la computadora”, dice.

Una investigación realizada por el Instituto Alan Turing y la University College London demuestra que nuestro rostro, el color de los ojos o del pelo o incluso nuestro nombre no interesan para que Wallmart nos haga una oferta o para que alguien decida si tenemos alguna inclinación por el fundamentalismo o por su primo hermano, el terrorismo.

Qué somos

Para internet se toma en cuenta la hora de conexión, los ‘likes’ que damos, la fecha de creación de nuestra cuenta o las palabras que más usamos. Esos metadatos son los que pueden ser recolectados. Los metadatos, según los investigadores Beatrice Pérez y Mirco Musolesi, se han convertido en la forma más nueva de moneda y análisis de datos. Es a la vez un negocio y un esfuerzo académico.

Dicen los autores: “Cuando las redes sociales se introdujeron por primera vez, la privacidad no era una preocupación importante para los usuarios y, por lo tanto, tampoco era una prioridad para los proveedores de servicios. Las preocupaciones de privacidad han aumentado: los usuarios comenzaron a considerar las implicaciones de información que comparten y, en respuesta, las redes sociales han introducido controles para que los usuarios gestionen sus datos”.

El caso Facebook

Se suele pensar que la preocupación por la privacidad tuvo un punto de inflexión cuando se supo este año que una empresa (Cambridge Analytica) utilizó datos de usuarios de Facebook para influir en las elecciones de EEUU. En realidad, explica Israel Rosales, Facebook ya protegía los metadatos de los usuarios antes de ese escándalo.

No hay que olvidar que fue la investigación del sicólogo Aleksandr Kogan la que recopiló esos datos para realizar un test de personalidad. Kogan tuvo autorización de Facebook para acceder a esa información.

El trabajo de Pérez y Musolesi se realizó en Twitter, pero es perfectamente aplicable a todas las redes y todo el contenido subido a la red. Utilizando algoritmos, los investigadores pudieron identificar a un usuario entre otros 10.000 con una precisión del 95%, usando solo sus metadatos. Incluso si se utilizaba solo el 65% de la información, era posible tener una precisión de 90% al identificar a un usuario.

Los criterios empleados para esta identificación fueron nueve: número de tuits favoritos, cantidad de seguidores, cantidad de usuarios seguidos, geolocalización de los tuits, cantidad de listas públicas en la cuenta, hora de cada publicación, fecha en que la cuenta fue creada, cantidad de tuits y, finalmente, si la cuenta está o no verificada. Con eso basta para dejar al ‘desnudo’ a los usuarios de internet.

La amenaza

Con esta información recopilada la publicidad dirigida puede ser usada para entender las inclinaciones políticas y religiosas del usuario. Según los autores, a través del análisis de texto es posible derivar edad, sexo y orientación política de las personas. Desde 2012 se sabe que también es posible establecer el estado de ánimo general de los grupos y de las personas. El análisis de la imagen revela, por ejemplo, el lugar de una foto, el lugar de residencia del fotógrafo o el estado de relación de dos personas.

Si miramos la movilidad de datos de redes sociales basadas en la ubicación y el uso habitual del lenguaje, se puede establecer el origen cultural. Si un atacante solo tuviese acceso a conjuntos de datos anónimos, mirando la estructura de la red podría ser capaz de volver a identificar a los usuarios.

Solución: usar navegadores como Tor y sitios como PasteBin para compartir textos o utilidades como Doc Scrubber y MetaStripper para borrar metadatos. Simplewash nos borra de las redes.