Temas Calientes

Biblioteca del Congreso estadounidense archivó todo Twitter hasta el 2010. Buscar algo tarda 24 horas

(CC) 'Pong

(CC) 'Pong

Twitter y la Biblioteca del Congreso estadounidense firmaron un acuerdo el 2010 para que la institución pudiera tener acceso a todos los tuits públicos entre el 2006 y abril del 2010 con el fin de resguardarlos para la posteridad.

Finalmente, la institución anunció que tras tres años terminó de archivar todos los 170 mil millones de tuits de Twitter, desde sus inicios hasta el 2010, a una velocidad de 500 millones de tuits al día, y juntándolos en un archivo de 133,2 terabytes (que incluye dos copias comprimidas del archivo).

Si bien es una buena noticia pues permitiría acceder a masivas cantidades de información pública para ser analizada por parte de profesionales como sociólogos (aunque el acuerdo con Twitter estipula que no se podrá acceder a través de Internet ni hacer públicos los tuits), hay un pequeño problema: Una búsqueda puede tardar hasta 24 horas para encontrar un tuit entre el 2006 y el 2010.

O sea, si bien la Biblioteca del Congreso logró su tarea de registrar todo lo escrito por Twitter desde sus inicios hasta el 2010 (a lo que continuará sumando nuevos tuits hasta llegar a un desfase de seis meses con los escritos el día de hoy), es una cantidad tan masiva de información que para mejorar las búsquedas se requerirá invertir “en cientos, sino miles, de servidores. Lo que es un costo prohibitivo y poco práctico para la institución“, aseguraron en la Biblioteca del Congreso estadounidense.

Link: Library of Congress will complete Twitter archive through 2010 this month, now has 170B tweets on file (The Next Web)

12 Comentarios

Biblioteca del Congreso estadounidense archivó todo Twitter hasta el 2010. Buscar algo tarda 24 horas

Thumb up 32 Thumb down 0 avatar_Carlos Carlos dijo hace 6 meses

En el momento en que dejaste como PÚBLICOS los tweets

Thumb up 3 Thumb down 0 avatar_jorge jorge dijo hace 6 meses

pregúntale al usuario, los que archivaron son los tuits públicos, los que todo el mundo puede ver

Thumb up 4 Thumb down 0 avatar_Kotolo Kotolo dijo hace 6 meses

estoy empezando a sospechar que este wn es denis encubierto


o simplemente un pelotudo xD

Thumb up 8 Thumb down 2 avatar_LEONARDO LEONARDO dijo hace 6 meses

Me impresiona la cantidad de cándidos que cree que estas noticias son la realidad.
Seguramente FB/TW/in/Google/Gmail/etc. no comparten su información con el Gobierno de USA.
Claro, sus datos son privados, si, si......

Responder
Thumb up 2 Thumb down 4 avatar_david david dijo hace 6 meses

Si demora 24 el software esta malo...

Responder
Thumb up 11 Thumb down 7 avatar_Ignacio Ignacio dijo hace 6 meses

@Denis buen comentario. Casi te voto positivo, pero lei tu nombre y mi conciencia me dijo que te votara negativo. Lo siento :yaoming:

Thumb up 0 Thumb down 0 avatar_Juan Juan dijo hace 5 meses

Yo cambiaría tu comentario a "si un algoritmo de baja complejidad demora más 24 horas quizás puede mejorarse".

Thumb up 0 Thumb down 1 avatar_OttoPetersen OttoPetersen dijo hace 5 meses

Big Data

Responder
Thumb up 0 Thumb down 1 avatar_jaimito jaimito dijo hace 5 meses

24 hrs?... Contraten Google, y fin del asunto xD

Responder

Deja tu Comentario

La opción de comentar está abierta a todos los usuarios, pero te pedimos por favor mantenerte dentro del tema del artículo y no publicar comentarios ofensivos o publicidad basura. Nos reservamos el derecho de eliminar cualquier comentario que no cumpla estas reglas.

Para que aparezca tu foto en vez del icono genérico en tu comentario, el email con el que comentas debe estar inscrito en Gravatar.

*