Google tiene un trillón de páginas en su índice

Google tiene un trillón de páginas en su índice

por

En realidad es un “trillion” gringo

Cuando Google debutó en 1998, su índice tenía 26 millones de páginas y era como en el chiste de Gary Larson cuando Carl Sagan mira hacia el cielo a los 6 años y dice: “debe haber cientos de estrellas”. En realidad, con 26 millones de páginas no tenían nada, pero crecieron exponencialmente en los años que siguieron llegando a un billion (10[SUP]9[/SUP]) y este año, a un trillion (10[SUP]12[/SUP]). En rigor, Google no guarda el trillón completo, pero sabe (por la cantidad de links distintos) cuanto hay en el universo, tanto indexado como por indexar.

Google lo plantea en su blog en términos de: “miren cuánto ha crecido el índice” y Mike Arrington les dedica una editorial diciendo: “el tamaño de su índice y el tamaño de la web son cosas muuuuy distintas”. Pero para ser magnánimos, si el 10% de los links presentes en la web apuntasen a contenido duplicado, en realidad es más sano no indexar ese contenido, verdad?

Aunque por cierto felicitamos a Google por el hito -aunque es un hito de la web más que de su índice-, en realidad hace muchos años que la fortaleza de los buscadores no se mide por la cantidad de sitios indexados, sino por la relevancia de los resultados desplegados, algo en lo que Google también es líder.

Respecto a esto último, nos enteramos de que Microsoft está desarrollando su propio pagerank, al cual llamaron con mucha originalidad, browserank. A diferencia del Pagerank no se basa en los links que apuntan a una web como medida de su relevancia, sino al uso que le dan los navegantes. Cuánto visitan cada sitio, cuánto tiempo pasan en él. Hay varios usuarios en CHW que nos suben el Browserank porque pasan todo el día conectados.

Yo me pregunto… y cómo podría saber Microsoft qué visitamos o cuánto lo visitamos si no es espiándonos?

Fuente: TechCrunch