.

Computación

TR10: Búsquedas en tiempo real

1

Las redes sociales están cambiando la forma en que encontramos la información.

  • por Nicholas Carr | traducido por Francisco Reyes (Opinno)
  • 21 Abril, 2010

Este artículo forma parte de una lista anual de las que, a nuestro juicio, son las 10 tecnologías emergentes más importantes. La lista completa se puede ver haciendo clic aquí.

¿Cómo se analiza un tweet? Hace cinco años, esa pregunta habría sido un galimatías. Hoy en día, es perfectamente razonable, y ocupa un lugar destacado dentro de la mente de Amit Singhal. Singhal dirige los esfuerzos de Google por incorporar nuevos datos en los resultados de búsqueda en tiempo real mediante el seguimiento y la clasificación de actualizaciones de contenidos en internet—especialmente los miles de mensajes que viajan a través de las redes sociales cada segundo.

La búsqueda en tiempo real es una respuesta a un cambio fundamental en la forma en que la gente usa internet. La gente solía visitar una página, hacía clic en un vínculo y visitaba otra página. En la actualidad los usuarios pasan mucho tiempo observando flujos de datos—tweets, actualizaciones de estado, titulares—procedentes de servicios como Facebook y Twitter, así como de blogs y medios informativos.

Los ‘info-nuggets’ efímeros son la nueva moneda de cambio en internet, y viajar a través de ellos para obtener información útil es un reto para los motores de búsqueda. Su aspecto más desalentador, según Singhal, no es la recogida de los datos. Facebook y Twitter no tienen problemas a la hora vender el acceso a sus flujos de datos—o "mangueras", como ellos los llaman—directamente a los proveedores de búsquedas; la información se vierte directamente en los ordenadores de Google.

Lo que resulta realmente duro acerca de la búsqueda en tiempo real es averiguar el significado y el valor de estos bits fugaces de información. El desafío va más allá del filtrado del spam, aunque esa es una parte importante del asunto. Aquellos usuarios que precisan datos de búsqueda en tiempo real quieren la misma calidad, autoridad y relevancia que esperarían cuando realizan búsquedas tradicionales en internet. Nadie quiere beber directamente de una manguera contra incendios.

Google domina las búsquedas tradicionales gracias a un meticuloso seguimiento de los enlaces a una página, así como de otras señales que configuran su valor acumulado a lo largo del tiempo. No obstante, con las búsquedas en tiempo real, esto no funciona. Los mensajes en las redes sociales pueden perder su valor a los pocos minutos de ser escritos. Google tiene que medir su valor en segundos, o incluso microsegundos.

Google es notoriamente hermética a la hora de hablar de sus algoritmos de búsqueda, aunque Singhal nos explica algunas de las variables que la empresa utiliza para analizar lo que él llama "charlas". Algunas son sencillos. Un usuario de Twitter que atraiga a muchos seguidores, y cuyos tweets sean a menudo "retweeteados" por otros usuarios, se puede suponer que, en general, es un usuario que posee más autoridad. Del mismo modo, los usuarios de Facebook ganan autoridad cuando sus amigos se multiplican, sobre todo si los amigos también tienen muchos amigos.

Otras señales son más sutiles. Un aumento repentino en la prevalencia de una palabra en una secuencia de mensajes—terremoto, por ejemplo--puede indicar un acontecimiento importante. Si un mensaje sobre un tema frecuentemente discutido incluye frases poco comunes, eso puede ser señal de la aparición de nueva información o nuevos conocimientos. Google, afirma Singhal, hace un barrido continuado de los cambios en el lenguaje y otras desviaciones de comportamiento previsto.

La compañía también está trabajando para conectar el contenido del mensaje con los datos de geolocalización transmitidos por los teléfonos inteligentes y otros equipos móviles, o medios de difusión como el servicio Foursquare. La ubicación de la persona que envía un mensaje puede ser de gran importancia. Si usted sabe que una persona está enviando tweets sobre un terremoto y está cerca del epicentro, es probable que sus tweets sean más valiosos que aquellos a cientos de kilómetros de distancia.

Singhal considera la búsqueda en tiempo real como algo muy en línea con la estrategia de Google: la destilación de una mezcla confusa de datos que son más relevantes para una persona individual en un momento determinado. Otros proveedores de búsquedas, incluyendo al rival de Google, Microsoft, están tomando una visión más radical.

A Sean Suchter, que dirige el Centro de Tecnología de Búsqueda de Microsoft en Mountain View, California, no le gusta el término de búsqueda en tiempo real, que considera demasiado restrictivo. Piensa que el motor de búsqueda Bing de Microsoft debería no sólo filtrar los datos derivados de las redes sociales, sino convertirse en una extensión de ellos.

En última instancia, afirma Suchter, las conversaciones uno-a-uno se llevarán a cabo dentro de Bing, provocadas por las palabras que las personas introduzcan. La búsqueda en tiempo real, predice, será tan diferente de lo anterior que eliminará las ventajas acumuladas por Google desde hace tiempo. "La historia no tiene importancia aquí", afirma. Después de una pausa, añade: "Vamos a usarlos para limpiar el suelo."

Amit Singhal ha escuchado este tipo amenazas con anterioridad, y hasta ahora no han llegado a mucho. No obstante, incluso él admite que la búsqueda en tiempo real es lo que más se aproxima al concepto de "ruptura radical" dentro la historia de las búsquedas. Mantener a Google en lo alto durante la era de las charlas puede llegar a ser la prueba más dura por la que tenga que pasar Singhal.

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. Starlink: la solución a la brecha digital que casi nadie podrá pagar

    Aunque la tarifa mensual para acceder a internet con sus satélites LEO resulta asequible, requiere un alto precio de instalación inalcanzable para muchos, a pesar de que SpaceX lo vende en pérdidas. Necesitará aumentar su base de clientes para ser rentable y económico, pero eso reducirá la velocidad para todos

  2. Disfraces hacker y banderas falsas para camuflar ciberdelitos internacionales

    Muchos piratas informáticos intentan disfrazar sus ataques para que parezcan culpa de otros países, pero sus objetivos finales y técnicas siempre les acaban delatando. El último caso es el del grupo hacker chino que se hizo pasar por iraní para atacar al Gobierno de Israel y a sus empresas tecnológicas

  3. La doble moral de Apple con su tecnología contra la pornografía infantil

    Ante las críticas y preocupaciones sobre los malos usos que se podrían dar a la herramienta, el gigante afirma que el software puede ser analizado libremente por los investigadores. Sin embargo, ha invertido mucho para evitar justo eso y ha demandado a una empresa que ofrece un servicio para hacerlo