Prólogo: Introduzco una
nota: Adrián Paenza en su artículo (periódico Página12, del 22/08/2013) analiza
con método sigue las huellas de los hinchas de..Boca/ del América. Ambos
clubes de futbol están ligadas a transnacionales mediáticas lo cual es directo
en el caso del América, en el caso de Boca , Mauricio Macri es uno de los
líderes mediáticos protegidos por el grupo Clarín (periódicos, televisión,
radio) Televisa apoya la privatización de Pemex, calificada de “reforma”; M. Macri
en la Argentina impulsa el regreso a manos privadas de la empresa Y.P.F.
Adrián Paenza despliega ese método
que se organiza sobre una constatación mínima “aquí pasó alguien”, en este caso
”aquí se hizo una llamada o se movió”. Este método permitió a Freud inventar el
psicoanálisis, Jacques Lacan lo modificó dando un sesgo más interesante se trata
del método conjetural. Tras ellos están los estudios de Giovanni Morelli (pintura), Conan Doyle (Sherlock
Holmes), Charles Sanders Peirce (semiótica). Subrayo estos investigadores recién
citados tomaron debida cuenta de una experiencia más elemental y compartida: el
arte de la caza (por aquí pasó tal o cual animal), la fabricación artesanal de
utensilios; el arte del tejido y el arte de las mujeres (confeccionan ropas
para sus críos sin todavía verlos).
Paenza muestra que junto con el
empleo activo por parte del poder de esas huellas, está abierta su reconducción
hacia otros empleos, por ejemplo, lanzar un mensaje vía celular contra la
reforma petrolera privatizadora que amenaza a México y su forma de Estado y
estudiar cómo se mueve, cómo se transmite tal mensaje, sería una forma quizás
inédita de estudiar aquello que los medios masivos propietarios del América en
México y del Boca en Argentina soslayan o ningunean: seguir las huellas de los ciudadanos que no aceptan la privatización, ver cuántos son, ... ¿A usted qué le parece?¿Análisis
celular?
Hinchas del Boca/América, por Adrían Paenza
¿Cuántos teléfonos celulares hay
en la Argentina o en México? La respuesta depende de la fuente que uno
consulte. Algunos sostienen que hay más de 50 millones y otros un poco menos.
No importa. A los efectos de lo que quiero proponerle pensar, lo más relevante
es que hay decididamente más teléfonos celulares que personas que habitan el
país.
Las compañías telefónicas que
proveen el servicio de telefonía celular poseen una herramienta de un
extraordinario poder: la base de datos que generan sus usuarios. Pero espere:
no me refiero a los nombres de las personas que son dueños de los teléfonos. Ese
sería un dato insignificante, equivalente a decir que tienen los nombres de una
guía telefónica 1). No. Me refiero a otra cosa.
Cada vez que usted hace una
llamada con uno de ellos, no sólo está usando su teléfono y el número que tiene
asignado, sino que también necesita usar una antena (o más). En el momento en
que se produce la llamada, la señal que usted envía llega a la “torre” más
cercana que tiene su proveedor. Desde allí sigue entonces el proceso. Si usted
se está moviendo, las antenas van cambiando a medida que usted va cambiando de
locación, y esta operación es totalmente transparente para el usuario que no
presta atención (ni razón hay para que lo haga) al despliegue tecnológico
necesario para que la conexión ocurra y se mantenga.
Sin embargo, todos estos
miniepisodios quedan registrados. Usted no es más dueño de lo que hizo, sino
que ha dejado una cantidad de rastros/huellas, algo así como si hubiera marcado
con una tiza todo su trayecto. Fíjese que estoy omitiendo hablar del contenido
de su conversación. Esa sería la preocupación más frecuente, por lo que
significaría una obvia invasión a la privacidad. Pero hay otro tipo de datos
que quedan registrados y que les otorgan a las telefónicas un poder descomunal.
Es tan grande el poder que tienen con esa base de datos, es tan extraordinaria
su potencialidad, que creo que debería discutirse si ese material les pertenece
o si debiera ser regulado por el Estado. No sé. No he pensado el tema y estoy
seguro de que habrá gente experta que tendrá opiniones educadas. La mía,
ciertamente no lo es. Pero quiero explayarme un poco más en por qué considero
que esa base de datos contiene adentro una cantidad de información que podría
cooperar en la solución de muchísimos problemas. ¿De qué hablo? Me explico, primero
con un ejemplo.
Nicolás Ponieman, Alejo Salles y
Carlos Sarraute [2] son tres científicos argentinos egresados de la universidad
pública. Trabajan –entre otras cosas– como asesores/consultores de distintas
compañías telefónicas que proveen servicios de telefonía celular. Cada una de
estas compañías es poseedora de los datos de los que hablaba más arriba. Es
decir: las compañías tienen registradas todas las llamadas entrantes y
salientes que recibió cada teléfono, qué antenas fueron utilizadas y durante cuánto
tiempo. Las empresas codifican los números de los usuarios de manera tal que al
entregar el material, no sólo no aparece nada de lo conversado, sino que
tampoco aparece el número del usuario: es un código. Por supuesto, el código de
cada teléfono será siempre el mismo a lo largo de cualquier estudio y/o uso que
se haga con ellos. Por otro lado, los resultados que provengan del análisis de
esos datos solamente pueden ser utilizados con un fin académico (científico) y,
más aún, tienen que aparecer ubicados en distintas categorías (“agregados”),
sin individualizar ni revelar los detalles (en particular, el nombre de la
empresa).
Para que tenga una idea de la
magnitud del trabajo, piense que analizaron 40 millones de teléfonos celulares.
El objetivo era hacer un estudio que permita mejorar la predictibilidad de los
movimientos y la ubicación de grupos de personas. Es decir, en este caso
particular, estudiaron los movimientos de los que llamaron “hinchas de Boca/
del América” ¿Cómo hacer para detectar quiénes pertenecen a ese grupo? Se
propusieron identificar a los usuarios que hicieron llamadas en zonas aledañas
a la cancha de Boca o del América durante varios domingos seguidos en horarios
de partido y usaron ese material para distinguir/elegir algunos teléfonos
celulares de otros. No alcanza con que una persona hubiera ido a la cancha con
un teléfono celular, sino que para que quede un registro tiene que haber hecho
o recibido alguna llamada en el lapso que se fijaron para el estudio[3]. Por
supuesto, no se les escapa a ellos ni a usted que es una identificación muy
grosera, pero, a los efectos prácticos, es una buena aproximación.
Como decía más arriba, el
objetivo era poder predecir la locación y la movilidad de los teléfonos
celulares de personas que pertenecían a ese grupo (“hinchas de…”) en un
determinado momento.
En esta suerte de prueba piloto
quise saber cuáles eran las hipótesis que tenían antes de hacer el relevamiento
y cuáles fueron las conclusiones que terminaron publicando.
Las hipótesis que querían verificar
con este estudio fueron:
+ que la movilidad de las
personas presenta –a nivel estadístico– muchas regularidades (se pueden
predecir con alta probabilidad de acierto).
+ que la ubicación de los
usuarios de celular se puede predecir también con una buena probabilidad de
acierto.[4]
+ que el modelo muy simple
utilizado se puede mejorar sensiblemente agregando información “externa” de
fenómenos sociales, como por ejemplo fue haber utilizado el organigrama del
torneo de fútbol.
Luego, una vez finalizado el estudio,
corroboraron todas esas hipótesis. El trabajo fue presentado con marcado éxito
en el congreso NetMob que se hizo a principios de mayo de este año en el MIT,
en Boston, Massachusetts (EE.UU.)[5]
Por supuesto, conocer dónde están
(o no) los hinchas de… tiene una utilidad relativa. En todo caso, servirá para
los servicios de marketing que seguramente estarían interesados en conocer este
material.
Pero lo que yo quiero poner en
evidencia acá es que con esos datos es posible –por ejemplo– analizar el flujo
de personas que ingresan (y egresan) del centro de una ciudad, para mejorar y
optimizar la distribución del transporte público, de ofrecer rutas
alternativas, de guiar al tránsito en tiempo real (como se hizo en un estudio
espectacular con la misma idea en Costa de Marfil). O bien aprovechar los datos
que dejaron los teléfonos celulares en Haití luego del terremoto del año 2010,
para entender cómo se produce la dispersión de personas luego de una catástrofe
natural.
Un trabajo equivalente con
cualquier base de datos de similares características permite mejorar la
predictibilidad en la movilización y ubicación de las personas involucradas,
pero al mismo tiempo, este mismo tipo de modelos permite predecir y entender procesos
más complejos tales como la forma en la que se desparrama o distribuye la
información, o incluso un rumor, o cuáles son los patrones con los que se
esparce un virus o una enfermedad contagiosa. Y los ejemplos podrían seguir.
Cada día el mundo digital genera
varios millones de millones de millones de bytes [6] que provienen de múltiples
fuentes: sensores climáticos, redes sociales, imágenes digitales, videos
subidos a Internet o compras hechas usando la red y, como está explicado más
arriba, las llamadas efectuadas por usuarios de teléfonos celulares, por sólo
nombrar algunas. El aprovechamiento de todos estos datos, saber desbrozarlos,
desagregarlos, entenderlos y rescatar los mensajes que tienen escondidos, es
uno de los mayores desafíos de la tecnología de la información. De momento, las
compañías telefónicas recogen y almacenan una cantidad de datos que si es bien
interpretada puede proveer una información macroscópica muy valiosa sobre las
interacciones de la población. Justamente, el análisis cuidadoso de ellos puede
transformarse entonces en una herramienta muy poderosa para mejorar esas
interacciones, optimizarlas... La Argentina, México no pueden quedarse atrás. Y
una vez más: ¿no valdría la pena discutir si esas bases de datos deberían ser
reguladas por el Estado también? ¿No debería tener el Estado acceso a esa
información para mejorar las condiciones de vida de la población? ¿Usted qué
piensa?
[1] ¿No es notable que haya guías
de teléfonos con líneas fijas, pero no de celulares?
[2] Nicolás Ponieman es
estudiante de la licenciatura en Física, en Exactas (UBA); Alejo Salles es
egresado de Exactas (UBA) y doctor en Física de la Universidade Federal do Rio
de Janeiro (UFRJ); y Carlos Sarraute es egresado de Exactas (UBA) y doctor en
Ingeniería Informática del ITBA. Ponieman y Sarraute trabajan en la compañía
Grandata mientras que Salles es investigador del Conicet.
[3] Cada llamada se identifica
por su nombre en inglés, CDR, Call Detail Record, o sea la “huella” que dejó la
llamada.
[4] Para preparar el modelo,
usaron un conjunto de antenas que les sirvieron como entrenamiento durante
cinco semanas.
[5] El trabajo puede verse acá:
http://www.technologyreview.com/news/514646
/glimpses-of-a-world-revealed-by-cell-phone-data/ y forma parte de Third
Conference on the Analysis of Mobile Phone Dataset (“Tercera Conferencia sobre
el Análisis de la Base de Datos de los Teléfonos Móviles”).
[6] Millones de millones de
millones es equivalente a 1018, o sea un uno seguido de ¡dieciocho ceros!
No hay comentarios.:
Publicar un comentario