…o se quiere quedar con nosotros.
(Vía Search Engine News) En una entrada del día de ayer del blog de Jason Dowdell nos encontramos con un interesante enlace hacia una página de microsoft: Block-level Link Analysis. Se trata de una explicación del funcionamiento del algoritmo de su motor de búsqueda. Que viene a decir algo así como:
El análisis de enlaces ha demostrado tener un gran potencial en la realización de búsquedas. PageRank y Hits son dos de los algoritmos más populares. La mayoría de los algoritmos existentes basados en análisis de enlaces tratan una página como un nodo simple en una grafo de webs. En la mayoría de los casos una página puede tener una semántica variada y la página no debe ser considerada un nodo único. En el Pdf (el papel, patente, que explica el tema) la página es dividada en bloques usando un algoritmo de segmentación de páginas. Estrayendo los bloques a páginas y las páginas a bloques, las relaciones de la estructura de enlaces y el análisis de la página, podemos construir un grafo semántico de la red, de tal forma que un nodo represente un tema. Este grafo puede describir mucho mejor la estructura semántica de una web. Basado en el análisis de bloques de enlaces por niveles, proponemos dos nuevos algoritmos. Block Level PageRank y Block Level HITS, cuya implementación estudiamos exhaustivamente con datos de webs.
Estas explicaciones, como siempre, resultan muy agradables, pero la realidad es otra. Los resultados del nuevo MSN mejoran, pero siguen siendo malos. Peores que los de Google, aunque, creo, mejores que los de Yahoo!.
El pdf de la explicación lo podéis bajar, es bastante completo y… ¿aburrido? (todavía no lo he leído).


Agosto 13th, 2004 at 7:03 pm
Bueno, yo no encuentro tan malos los de Yahoo, de hecho creo que son mejores que los de MSN y algunas veces que los de Google.
Agosto 25th, 2004 at 9:04 pm
´Quizás es debido a que aún está realizando pruebas. En la lectura rápida que he realizado después de vacacionespara ponerme al día un poco, me ha parecido leer que estará terminado el día 13 de diciembre (para una conferencia que está en esa fecha)