Societat

RICARDO BAEZA-YATES

VICEPRESIDENT D'INVESTIGACIÓ A YAHOO LABS

“Sabrem abans que tu allò nou que t'agradarà”

“No té límits i és molt més gran del que ens imaginem, però encara estem en una fase inicial”

“Una de les coses que mirem és quina mena de moviments fem amb el ratolí mentre naveguem”

El xilè Ricardo Baeza, especialista en mineria de dades i responsable d'investigació a Yahoo, on lidera diversos laboratoris a banda i banda de l'Atlàntic, va ser recentment a Barcelona oferint una classe magistral en el congrés sobre dades massives

La sensació és que aquest camp té un gran potencial en molts àmbits, però que de moment només l'aprofita el sector empresarial i vetlla pels seus interessos...
Això és el que pot semblar des de fora, però en realitat els usuaris també noten beneficis derivats de les big data. Per exemple, tenint serveis com el correu electrònic, l'accés al núvol o les xarxes socials, que funcionen cada cop millor i que són totalment gratuïts. I ho són per a tothom perquè uns quants usuaris els mantenen fent clic a les publicitats que els presentem d'acord amb els seus interessos, segons el que sabem utilitzant les big data. Sí que és cert, però, que hi ha altres camps, com ara la medicina personalitzada, en què també hi pot jugar un gran paper i encara no ens hi hem posat.
Tenia entès que això requeria molta capacitat de computació...
Correcte, però al final la diferència entre això i les big data és molt difícil d'establir. On situem els límits? En un petabyte? Les big data no tenen límits i són molt més grans del que ens podem imaginar, però tot just ara comencem a explotar-les...
La gent pot pensar que als serveis web els interessa on fem clic, però la realitat és que investiguen el que fem molt més enllà, oi?
Sí. El fet que la gent cliqui el primer resultat del cercador a nosaltres no ens aporta res. En canvi, que ho faci en el 33 sí que és molt més valuós. A més, ens fixem en moltes altres coses, com per exemple si es fa scroll per veure la pàgina sencera o no, el temps que s'hi està i també quins moviments fa l'usuari amb el ratolí.
Quina informació aporta això?
Tot ens dóna informació sobre els perfils d'usuaris, i hi ha diversos estudis de mouse tracking. És curiós veure com hi ha gent que quan navega necessita anar ajudant-se del cursor fent-lo passar per les frases que llegeix, d'altres que no el toquen gaire, uns altres que els mouen compulsivament com si es morissin de ganes de fer el següent clic... de tot se n'aprèn, sobretot creuant les dades.
Així doncs, els gegants d'internet poden arribar a tenir un perfil molt exhaustiu sobre els usuaris. Fins i tot podria ser que els coneguessin millor del que ho fan ells mateixos?
Sí. De fet aquesta és la idea d'algun dels projectes que nosaltres tenim en marxa i que ja ha donat alguns fruits. Ens interessa, per exemple, saber abans que tu quines coses t'agradaran en un futur, però no les relacionades amb les coses que ja ho fan ara, sinó en camps que ni tan sols coneixes. M'explico: presentar-te propostes relacionades amb el que ja has demostrat que t'interessen és relativament senzill. Ara el següent pas és mirar entre la gent que és com tu perquè li agrada el mateix, quins altres interessos tenen que tu encara no has descobert, per poder-te'ls introduir.
Davant d'aquest panorama, encara s'entén més que la gent pateixi per la seguretat i la privacitat de les seves dades...
Clar que s'entén, però han de saber que a Yahoo, i suposo que a la resta de llocs, tenim el departament que anomenem de “paranoics” que es dediquen a vetllar precisament per això. Mentre les dades no surtin de les empreses que les gestionen, poden estar tranquils. Els problemes, per exemple d'identificació de persones a partir de dades anònimes, han vingut quan s'han ofert, amb bons propòsits, les dades a tercers.



Identificar-me. Si ja sou usuari verificat, us heu d'identificar. Vull ser usuari verificat. Per escriure un comentari cal ser usuari verificat.
Nota: Per aportar comentaris al web és indispensable ser usuari verificat i acceptar les Normes de Participació.