Temas Calientes

Investigadores intentaron medir cuánto de la Internet está almacenada para siempre

book11111

Para nadie es misterio que la cantidad de información generada en Internet es gigantesca, mucha de la cual es bastante útil para la humanidad y merece ser guardada para la posteridad. El conocimiento humano se ha almacenado históricamente a través de enciclopedias y textos, ¿pero qué ocurre con lo digital? Investigadores de la Old Dominion University en Estados Unidos han intentado responder esta pregunta, consiguiendo resultados poco exactos pero llegando a una conclusión interesante.

El primer obstáculo que encontraron para saber cuánto de la Internet se ha guardado, fue el intentar descubrir todas las direcciones web URL existentes. Rápidamente se dieron cuenta que no se podía, catalogando tal labor como “imposible”, por lo que tomaron un apronte más estadístico y decidieron sacar como muestra 1.000 sitios web desde diversas fuentes, como Open Directory Project (DMOZ), Delicio.us, Bit.ly y por supuesto, los buscadores Google, Bing y Yahoo!

Luego, buscaron si estos 1.000 sitios estaban almacenados para la posteridad en algún lado, buscando en las bases de datos históricas más populares. ¿El resultado? Varía según la fuente desde donde provienen las muestras. Los links desde Delicio.us y DMOZ están guardados en un 90%, mientras que los de bit.ly junto con los de los buscadores web muestran apenas un 35%, siendo los de memoria más volátil.

¿La conclusión? Es que es muy difícil saber cuánto de la Internet está almacenada, pues el sólo iniciar una investigación es complicado (por el tema de las URL) y los resultados obtenidos son demasiado variables, por lo que los investigadores tendrán que buscar otros métodos en el futuro.

Link: Computer Scientists Measure How Much of the Web is Archived (MIT Technology Review)

14 Comentarios

Investigadores intentaron medir cuánto de la Internet está almacenada para siempre

Thumb up 32 Thumb down 2 avatar_JP JP dijo hace 4 meses

Me parece que un estudio que considera una muestra de 1.000 sitios dentro de un universo total de billones de sitios web, cae más en la anécdota que en un resultado representativo.

Responder
Thumb up 12 Thumb down 3 avatar_Diego Diego dijo hace 4 meses

Por algo se llama muestra estadística, lo reto a sacar la muestra de un billón con margen de 0,4 de error y 99% de confianza. http://www.med.unne.edu.ar/biblioteca/calculos/calculadora.htm

Thumb up 16 Thumb down 0 avatar_JP JP dijo hace 4 meses

@Diego

Arroja un margen de error de 4.07%, lo cual es bastante razonable. Yo estaba equivocado.

Thumb up 0 Thumb down 0 avatar_Carlos Contreras Carlos Contreras dijo hace 4 meses

La deep web no es tan extensa como se dice, ya que cuando vemos las cosas que dicen en internet también se incluye lo que es intranet de empresas y asociaciones, por lo que si las descontamos, la deep web no es tan extensa.

Thumb up 30 Thumb down 0 avatar_andres andres dijo hace 4 meses

1.000.000.000.000 teras de porno

Responder
Thumb up 21 Thumb down 0 avatar_Clown Clown dijo hace 4 meses

@andres pero solo contaste el soft porn, te falto el resto...

Thumb up 2 Thumb down 3 avatar_Leon Wilhelm Leon Wilhelm dijo hace 4 meses

Umm no llevan los proveedores de servicios de Internet y los consorcios de ingenieros una lista de las IPs asignadas(tanto IPv4 como IPv6)? por ahí se podría buscar.

Responder
Thumb up 28 Thumb down 1 avatar_pock pock dijo hace 4 meses

no entiendo la noticia
almacenado para siempre en discos duros de adamantium en bunkers de concreto a 7 metros bajo la tierra y apagados en estantes en un vacio absoluto? para mi eso es almacenado para siempre

los millones de sitios actualmente estan almacenados, sino como chucha los vemos?

a que se refieren para siempre? tiene un respaldo fisico? y si es asi como diablos pueden llegar a saber eso?

no entiendo la nota, y no veo por donde la muestra sea representativa, y no critico la estadistica, sino la metodologia supuestamente aplicada aqui.

Responder
Thumb up 1 Thumb down 0 avatar_FBI FBI dijo hace 4 meses

Megaupload no está entre esos sitios.
Lo de FBIbook sí.

Responder
Thumb up 3 Thumb down 0 avatar_McCoy McCoy dijo hace 4 meses

No tiene sentido buscar links actuales...el problema está en el error 404, por ejemplo, toda la cantidad de información útil no respaldada, que se perdió con la muerte de geocities.

Responder
Thumb up 0 Thumb down 0 avatar_macoy macoy dijo hace 4 meses

pesimo articulo.

Responder

Deja tu Comentario

La opción de comentar está abierta a todos los usuarios, pero te pedimos por favor mantenerte dentro del tema del artículo y no publicar comentarios ofensivos o publicidad basura. Nos reservamos el derecho de eliminar cualquier comentario que no cumpla estas reglas.

Para que aparezca tu foto en vez del icono genérico en tu comentario, el email con el que comentas debe estar inscrito en Gravatar.

*