Investigadores intentaron medir cuánto de la Internet está almacenada para siempre
Para nadie es misterio que la cantidad de información generada en Internet es gigantesca, mucha de la cual es bastante útil para la humanidad y merece ser guardada para la posteridad. El conocimiento humano se ha almacenado históricamente a través de enciclopedias y textos, ¿pero qué ocurre con lo digital? Investigadores de la Old Dominion University en Estados Unidos han intentado responder esta pregunta, consiguiendo resultados poco exactos pero llegando a una conclusión interesante.
El primer obstáculo que encontraron para saber cuánto de la Internet se ha guardado, fue el intentar descubrir todas las direcciones web URL existentes. Rápidamente se dieron cuenta que no se podía, catalogando tal labor como “imposible”, por lo que tomaron un apronte más estadístico y decidieron sacar como muestra 1.000 sitios web desde diversas fuentes, como Open Directory Project (DMOZ), Delicio.us, Bit.ly y por supuesto, los buscadores Google, Bing y Yahoo!
Luego, buscaron si estos 1.000 sitios estaban almacenados para la posteridad en algún lado, buscando en las bases de datos históricas más populares. ¿El resultado? Varía según la fuente desde donde provienen las muestras. Los links desde Delicio.us y DMOZ están guardados en un 90%, mientras que los de bit.ly junto con los de los buscadores web muestran apenas un 35%, siendo los de memoria más volátil.
¿La conclusión? Es que es muy difícil saber cuánto de la Internet está almacenada, pues el sólo iniciar una investigación es complicado (por el tema de las URL) y los resultados obtenidos son demasiado variables, por lo que los investigadores tendrán que buscar otros métodos en el futuro.
Link: Computer Scientists Measure How Much of the Web is Archived (MIT Technology Review)
Yahoo! aprueba la compra de Tumblr por US$1.100...
Pyton S3, un dispositivo que corre Ubuntu, Andr...
Lo mejor de Google I/O 2013 #IO13
Yahoo! y Facebook enfrentadas para adquirir Tumblr
Bill Gates supera a Carlos Slim como el hombre ...
Larry Page y la polémica que despertó contra Mi...
El nuevo Google Maps a primera vista
Google Glass a primera vista
14 Comentarios
Investigadores intentaron medir cuánto de la Internet está almacenada para siempre
Me parece que un estudio que considera una muestra de 1.000 sitios dentro de un universo total de billones de sitios web, cae más en la anécdota que en un resultado representativo.
ResponderPor algo se llama muestra estadística, lo reto a sacar la muestra de un billón con margen de 0,4 de error y 99% de confianza. http://www.med.unne.edu.ar/biblioteca/calculos/calculadora.htm
@Diego
Arroja un margen de error de 4.07%, lo cual es bastante razonable. Yo estaba equivocado.
La deep web no es tan extensa como se dice, ya que cuando vemos las cosas que dicen en internet también se incluye lo que es intranet de empresas y asociaciones, por lo que si las descontamos, la deep web no es tan extensa.
1.000.000.000.000 teras de porno
Responder@andres pero solo contaste el soft porn, te falto el resto...
Umm no llevan los proveedores de servicios de Internet y los consorcios de ingenieros una lista de las IPs asignadas(tanto IPv4 como IPv6)? por ahí se podría buscar.
Responderno entiendo la noticia
Responderalmacenado para siempre en discos duros de adamantium en bunkers de concreto a 7 metros bajo la tierra y apagados en estantes en un vacio absoluto? para mi eso es almacenado para siempre
los millones de sitios actualmente estan almacenados, sino como chucha los vemos?
a que se refieren para siempre? tiene un respaldo fisico? y si es asi como diablos pueden llegar a saber eso?
no entiendo la nota, y no veo por donde la muestra sea representativa, y no critico la estadistica, sino la metodologia supuestamente aplicada aqui.
Megaupload no está entre esos sitios.
ResponderLo de FBIbook sí.
No tiene sentido buscar links actuales...el problema está en el error 404, por ejemplo, toda la cantidad de información útil no respaldada, que se perdió con la muerte de geocities.
Responderpesimo articulo.
ResponderDeja tu Comentario