por Steve Lohr
Miércoles, 17 de marzo 2010
proporcionada por
Si un desconocido se
acercara a usted en la calle, le daría su nombre, número de identificación y la
dirección de e-mail?
Probablemente no.
Sin embargo, la gente suele repartir todo tipo de información personal en
Internet permitiendo que tales datos de identificación sean deducidos.
Servicios como Facebook, Twitter y Flickr son los océanos de minucias
personales - tarjetas de felicitación enviados y recibidos, la escuela y
chismes de trabajo, fotos de vacaciones de la familia, y las películas vistas,
etc.
Los científicos en computación y expertos en política dicen que tales bits de
información aparentemente inocuos se pueden recoger cada vez más y volver a
montar por computadoras para ayudar a crear una imagen de identidad de una
persona, a veces hasta el número de Seguro Social.
"La tecnología ha hecho que la definición convencional de la
información personalmente identificable sea obsoleta", dijo Maneesha
Mithal, director asociado de la división de privacidad de la Comisión Federal
de Comercio. "Usted puede encontrar quien es un individuo es sin tener
información directa de él."
Hay un proyecto de clase
en el Instituto de Tecnología de Massachusetts que ha recibido cierta atención desde
el año pasado, Carter Jernigan y Behram Mistree analizaron más de 4.000
perfiles de estudiantes en Facebook, incluidos los enlaces a los amigos que
dijeron que eran gays. La pareja de estudiantes fue capaz de predecir, con un 78 por ciento de
exactitud, si un perfil pertenecía a un hombre homosexual.
Hasta ahora, este tipo de minería de datos de gran alcance, que se basa en
sofisticadas correlaciones estadísticas, se desarrolla sobre todo en el ámbito
de los investigadores universitarios, no ladrones de identidad y de marketing.
Sin embargo, la FTC está preocupada de que las normas para proteger la
privacidad no vayan al ritmo de la tecnología. La agencia ha convocado el
miércoles, al tercero de tres talleres sobre el tema.
Sus preocupaciones no son poco exageradas. El otoño pasado, Netflix (NFLX) otorgó $ 1 millón a un grupo de
estadísticos e informáticos que ganó un concurso de tres años para analizar el
historial de alquiler de películas de 500.000 suscriptores y mejorar la
exactitud de predicción de recomendación de software de Netflix por lo menos 10 por ciento.
El viernes, Netflix, dijo que iba a dejar de lado los planes para un
segundo concurso - cediendo a las preocupaciones planteadas por la privacidad
de la FTC y un litigante privado. En 2008, un par de investigadores de la
Universidad de Texas demostró que los datos de clientes obtenidos en un concurso,
despojados de nombres y otros datos de
identificación directa, a menudo pueden ser "des-anónimados" por el
análisis estadístico de patrones distintivos de un individuo en la clasificación de películas y recomendaciones.
En las redes sociales, las personas pueden aumentar sus defensas contra la
identificación mediante la adopción de controles de privacidad sobre la
información ajustada de los perfiles personales. Sin embargo, las acciones de
un individuo, dicen los investigadores, rara vez son suficientes para proteger
la intimidad en el mundo interconectado de Internet.
Puede que usted no revele inforrmación personal, pero sus amigos en línea y
los colegas lo pueden hacer por usted, en referencia a su escuela, colegio o lugar
de trabajo, género, ubicación e intereses. Los patrones de comunicación social,
dicen los investigadores, son reveladores.
"Intimidad personal ya no es una cosa individual", dijo Harold
Abelson, profesor de ciencias de la computación en el MIT "En el mundo en
línea de hoy, lo que tu madre te dijo es cierto: la gente realmente te juzga
por tus amigos".
Juntando todo, la piscina de la
información sobre cada individuo puede formar un distintivo de "firma
social", dicen los investigadores.
El poder de las computadoras para identificar a las personas desde patrones
sociales se demostró el año pasado en un
estudio realizado por el mismo par de investigadores que rompió la base de datos anónimos de Netflix:
Vitaly Shmatikov, profesor asociado de ciencias de la computación en la
Universidad de Texas, y Arvind Narayanan, ahora un investigador de la
Universidad de Stanford.
Al examinar las correlaciones entre las diversas cuentas en línea, los
científicos demostraron que podían identificar más de 30 por ciento de los
usuarios tanto de Twitter, el servicio de microblogging, y Flicker, un servicio
de fotos compartidas en línea, a pesar de que las cuentas habían sido despojadas
de la información de identificación como nombres de cuenta y dirección de
correo electrónico.
"Al vincular estos grandes conjuntos de datos en conjunto, una pequeña
parte de nuestro comportamiento y la estructura de nuestras redes sociales se
pueden identificar", dijo el Sr. Shmatikov.
Aún más inquietante para los defensores de la privacidad es el trabajo de
dos investigadores de la Universidad Carnegie Mellon. En un artículo publicado
el año pasado, Alessandro Acquisti y Ralph bruto informaron de que podían predecir
con exactitud el total de nueve dígitos de números de Seguro Social de un 8,5
por ciento de las personas nacidas en los Estados Unidos entre 1989 y 2003 -
cerca de cinco millones de personas.
Los números de Seguro Social son muy apreciados por los ladrones de
identidad, ya que se utilizan como identificadores y para autenticar la banca,
tarjetas de crédito y otras transacciones.
Los investigadores de Carnegie Mellon utilizaron la información disponible
al público de muchas fuentes, incluidos los perfiles en redes sociales, para
reducir la búsqueda de dos datos fundamentales para identificar a las personas
- fechas de nacimiento y la ciudad o estado de nacimiento.
Lo que les ayudó a descubrir los tres primeros dígitos del número de Seguridad
Social, fue el que Gobierno había asignado en cada localidad. Los restantes
seis dígitos había sido asignado a través de métodos que el gobierno no dio a
conocer, aunque se referían al momento cuando la persona solicitó el número.
Los investigadores utilizaron proyecciones acerca de las solicitudes, así como
otros datos públicos, como los números de Seguro Social de los muertos, y luego
corrió ciclos repetidos de correlación estadística y la inferencia en parte
re-diseñar el sistema de asignación de número del gobierno-.
Sin duda, el trabajo por el Sr. Acquisti y el Sr. Gross sugiere un
potencial, no real, de riesgo. Pero la investigación no publicada por ellos
explora cómo los delincuentes podrían utilizar técnicas similares de gran
identidad a escala en sus sistemas de robo.
Más en general, defensores de la privacidad se preocupan de que las nuevas
fronteras de la recopilación de datos, la intermediación y la minería, no son
en gran medida reguladas. Temen "línea roja en línea", donde los
productos y servicios se ofrecen a algunos consumidores y no a otros sobre la
base de las inferencias estadísticas y las predicciones sobre los individuos y
su comportamiento.
Pero Jon Kleinberg,
profesor de ciencias de la computación en la Universidad de Cornell, que
estudia las redes sociales, es escéptico de que las normas tendrán un gran
impacto. Su consejo: "Cuando usted está haciendo cosas en línea, usted
debe comportarse como si lo estuviera haciendo en público - porque cada vez más
eso es lo que sucede".
Traducción: kentauros@hotmail.es
No hay comentarios:
Publicar un comentario