El hombre del tiempo real: Amit Singhal, desde Google, está llevando a cabo procesos de minería en las redes sociales para generar resultados de búsqueda con sólo unos segundos de antigüedad.
Fuente: Toby Burditt
Informática
TR10: Búsquedas en tiempo real
Las redes sociales están cambiando la forma en que encontramos la información.
- Mayo/Junio 2010
- Por Nicholas Carr
- Traducido por Francisco Reyes (Opinno)
Este artículo forma parte de una lista anual de las que, a nuestro juicio, son las 10 tecnologías emergentes más importantes. La lista completa se puede ver haciendo clic aquí.
¿Cómo se analiza un tweet? Hace cinco años, esa pregunta habría sido un galimatías. Hoy en día, es perfectamente razonable, y ocupa un lugar destacado dentro de la mente de Amit Singhal. Singhal dirige los esfuerzos de Google por incorporar nuevos datos en los resultados de búsqueda en tiempo real mediante el seguimiento y la clasificación de actualizaciones de contenidos en internet—especialmente los miles de mensajes que viajan a través de las redes sociales cada segundo.
La búsqueda en tiempo real es una respuesta a un cambio fundamental en la forma en que la gente usa internet. La gente solía visitar una página, hacía clic en un vínculo y visitaba otra página. En la actualidad los usuarios pasan mucho tiempo observando flujos de datos—tweets, actualizaciones de estado, titulares—procedentes de servicios como Facebook y Twitter, así como de blogs y medios informativos.
Los ‘info-nuggets’ efímeros son la nueva moneda de cambio en internet, y viajar a través de ellos para obtener información útil es un reto para los motores de búsqueda. Su aspecto más desalentador, según Singhal, no es la recogida de los datos. Facebook y Twitter no tienen problemas a la hora vender el acceso a sus flujos de datos—o "mangueras", como ellos los llaman—directamente a los proveedores de búsquedas; la información se vierte directamente en los ordenadores de Google.
Lo que resulta realmente duro acerca de la búsqueda en tiempo real es averiguar el significado y el valor de estos bits fugaces de información. El desafío va más allá del filtrado del spam, aunque esa es una parte importante del asunto. Aquellos usuarios que precisan datos de búsqueda en tiempo real quieren la misma calidad, autoridad y relevancia que esperarían cuando realizan búsquedas tradicionales en internet. Nadie quiere beber directamente de una manguera contra incendios.
Google domina las búsquedas tradicionales gracias a un meticuloso seguimiento de los enlaces a una página, así como de otras señales que configuran su valor acumulado a lo largo del tiempo. No obstante, con las búsquedas en tiempo real, esto no funciona. Los mensajes en las redes sociales pueden perder su valor a los pocos minutos de ser escritos. Google tiene que medir su valor en segundos, o incluso microsegundos.
Google es notoriamente hermética a la hora de hablar de sus algoritmos de búsqueda, aunque Singhal nos explica algunas de las variables que la empresa utiliza para analizar lo que él llama "charlas". Algunas son sencillos. Un usuario de Twitter que atraiga a muchos seguidores, y cuyos tweets sean a menudo "retweeteados" por otros usuarios, se puede suponer que, en general, es un usuario que posee más autoridad. Del mismo modo, los usuarios de Facebook ganan autoridad cuando sus amigos se multiplican, sobre todo si los amigos también tienen muchos amigos.
- 1
- 2



