.

Computación

BlogRank contra PageRank

1

El último método para la búsqueda de blogs no está exento de errores

  • por The Physics Arxiv Blog | traducido por Francisco Reyes (Opinno)
  • 30 Marzo, 2009

Si usamos un motor de búsqueda para dar con un blog interesante o algún tema poco habitual, es probable que los resultados que obtengamos sean bastante pobres.

El problema es que los blogs no están unidos entre ellos con hiperenlaces, al contrario que el resto de la red, y por ese motivo los algoritmos de búsqueda tradicionales no sirven bien para hacen clasificaciones. Por ejemplo, el conocido algoritmo de Google, PageRank, basa sus resultados en el número de vínculos que apuntan a una determinada página web. Cuantos más vínculos reciba una página, más alto será su ranking. Pero también le da más valor a aquellos vínculos que procedan de sitios webs populares, por lo que el ranking final depende de la popularidad de la páginas con las que se esté vinculado.

Este es un buen método para las páginas webs normales, pero no funciona tan bien con la mayoría de los blogs puesto que los vínculos que apuntan a ellos carecen de información suficiente sobre su calidad o contenido. Por ejemplo, no se puede distinguir entre un vínculo hecho con buena intención y otro hecho con otros fines. Además, los blogs normalmente reciben menos vínculos que otro tipo de páginas, incluso cuando tienen un gran número de lectores y demuestran ser influyentes entre un grupo de personas específico pero reducido.

Así que, ¿cómo podemos mejorar las búsquedas entre blogs? Apostolos Kritikopoulos y sus colegas de la Universidad de Economía y Negocios de Grecia señalan que el factor más importante es reforzar el enfoque de PageRank con otra información relativa a la forma en que los blogs se vinculan entre ellos. Afirman que, por ejemplo, que es posible sacar el máximo partido a la temática del blog mediante el uso de etiquetas (tags), y también se pueden aprovechar las contribuciones hechas por autores y comentadores, así como la manera en que estos individuos añaden contenido a más de un blog.

Si tenemos en cuenta estos factores, el tipo de rankings que obtenemos al hacer una búsqueda de blogs cambia radicalmente. Para mostrarnos las diferencias que se obtienen con su método, Kritikopoulos y su equipo hicieron un ranking de los 1000 blogs más importantes, según un conjunto de datos de 2006, primero usando PageRank y luego usando su propio algoritmo, llamado BlogRank. Estos listados (junto con otro método de clasificación) sólo tienen 139 puntos en común.

Los 3 blogs con mejor clasificación según PageRank son:

  1. BoingBoing
  2. Engadget
  3. grahame.livejournal.com/

Los 3 blogs con mejor clasificación según PageRank son:

  1. nocapital.blogspot.com/
  2. pseudomanitou.livejournal.com/
  3. tbogg.blogspot.com/

No está clara la utilidad de BlogRank cuando se trata de búsqueda de palabras clave.

Pero sí es evidente que el equipo creador va a tener que esforzarse bastante para obtener la información que, según ellos, le da a BlogRank ventaja sobre sus competidores. Por ejemplo, no siempre es fácil obtener una lista de todos los comentadores en muchos de los blogs. E incluso cuando es posible, resulta difícil identificar a estos autores y comentadores porque suelen ocultar su identidad (ehem...).

Y eso puede ser lo que haga que BlogRank fracase.

Kritikopoulos y compañía concluyen diciendo que sus resultados experimentales son "bastante alentadores". Puede ser. También dicen que "tenemos que seguir experimentando con nuestro método, evaluándolo, y ajustando sus parámetros".

Eso está claro. Puede que pase algún tiempo antes de que tengamos un motor de búsqueda de blogs que funcione la mitad de bien que con el resto de la red.

Ref: arxiv.org/abs/0903.4035: BlogRank: Método para ranking de blogs basado en conectividad y similitud de contenidos.

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. La 'start-up' de EE UU que se enfrenta al gigante japonés de materiales para chips

    La financiación federal está impulsando a empresas estadounidenses como Thintronics a incursionar en la fabricación de semiconductores. El éxito está lejos de estar garantizado.

    Placas de circuitos electrónicos apiladas en una cadena de montaje.
  2. ASML, la empresa que revolucionó la fabricación de chips y quiere seguir haciéndolo

    ‘MIT Technology Review’ se reunió con el CTO saliente, Martin van den Brink, para hablar del ascenso de la empresa a la hegemonía y de la vida y muerte de la Ley de Moore  

    Dos trabajadores de ASML pasan por delante de la máquina UVE de alta apertura numérica en Veldhoven
  3. ‘Chiplets’: el arma de China en su batalla tecnológica contra EE UU

    Al conectar varios chips menos avanzados en uno, las empresas chinas podrían eludir las sanciones impuestas por el gobierno estadounidense.