Bloguero compra base de datos de un millón de usuarios de Facebook por US$5 y lo divulga
Bogomil Shopov, el bloguero checo que compró la base de datos de Facebook por migajas.
Cada vez que leemos una noticia que involucra a Facebook y la seguridad y privacidad de nuestros datos, ya imaginamos como va a terminar. Seguramente es lo que pensó el bloguero de República Checa Bogomil Shopov cuando, a pesar de no creer que fuera cierto, decidió comprar en Gigbucks, un portal de compra y venta de productos y servicios digitales a bajo costo, una base de datos de 1.1 millón de usuarios de Facebook, conteniendo direcciones de email, por la friolera de 5 dólares.
Al recibir el archivo de excel a cambio de su pago, Shopov cruzó algunos datos de la base con los perfiles de los usuarios para confirmar su veracidad y se encontró con la sorpresa de que esas cuentas no tenían su dirección de email en modo visible. Según la empresa que le vendió la base, se tratan de direcciones de email recolectadas por desarrolladores de aplicaciones para Facebook.
Esta confirmación lo motivó a escribir en su blog sobre el hecho y a especular un poco con la seguridad de la gran red social así como la exposición de los usuarios. Su post también trajo una segunda y sorpresiva respuesta, esta vez de parte de una cuenta de email de Facebook, donde lo invitaban a hablar con ellos vía telefónica para conocer más detalles sobre la situación además de pedirle encarecidamente que no divulgue la charla ni comparta la información escuchada ni difunda el accionar solicitado por Facebook, así como también que les mande el archivo, lo borre de sus computadoras y no hable con nadie.
Por suerte, para lo poco que queda de dignidad en internet y la constante defensa de la libertad de expresión, Bogomil no hizo caso y publicó todo lo conversado con Facebook. El objetivo de su publicación fue que el debate se hiciera público y que algún directivo de Facebook le respondiera en forma pública para que los usuarios sepan de qué tipo de problema se trató. Para Shopov esto no se trata de una acción inusual ya que pertenece a varios grupos de activistas que luchan por los derechos digitales en internet.Gigbucks, la empresa que vendió la base, también se comunicó con Bogomil para informarle que habían dado de baja la cuenta del vendedor de esa base ya que violó las normas del sitio, además de disculparse con él por no haber detectado dicha violación.
Desde acá, sólo esperamos que el bloguero Shopov haya llegado sano y salvo a su casa y no acepte de momento, ninguna solicitud de amistad de personas que no conozca, a fin de evitar algún mal trago de los hombres de negro de la red de Zuckerberg.
Link: bloguero búlgaro compró más de 1 millón de mails de usuarios de facebook por 5 dólares (techrancho)
Las redes sociales "rotas"
Hoy se cumplen 50 años de la primera mujer que ...
Los problemas para revelar las solicitudes del ...
Lo que no debes dejar de leer este fin de semana
Los gadgets que le regalábamos a papá hace cinc...
El futuro de tu cámara es Android
De la NASA a las Barras de Chocolate: TCHO
Woz habla sobre iOS 7 y el programa de vigilanc...![datascfreen1[1]](http://static.betazeta.com/www.fayerwayer.com/up/2012/10/datascfreen11.jpg)
53 Comentarios
Bloguero compra base de datos de un millón de usuarios de Facebook por US$5 y lo divulga
"Caa vez" que leo una noticia me sorprendo mas...
Responderyo compre la de servel en 2 lucas
tan cara???? después la publicaron gratis ellos mismos!!!
pide un reenbolso!!
lo del server la vende en menos $500.
lo que publico el server son archivos (pdf) con los datos, pasar esos a una base de datos, es un trabajo arduo...
pero por $500 te la mandan lista para ser usada.
esa base de datos es de concimiento publico...ahora bien...me llevo 4 horas en transformarla en excel...todo porque mi tarro es un vejestorio y ademas habia que comprobar errores...mas alla de eso...un mero tramite nada mas
"Los tengo a to'os identidica'os y den gracias maricones"
que mentirosos...
seguro que van a poder pasar 350 archivos en pdf (aprox. uno por comuna) con miles de datos cada uno (millones en total) en unas cuantas horas...
ademas de detectar los errores al transcibirlos al excel, pues las tablas del pdf no son tales para el excel y toda una linea queda en un casillero (y revisar linea por linea los millones de usuarios). elimimar los saltos de pagina dentro de un pdf, los encabezados de cada pagina y buscar los patrones para generar los saltos de coumnas.
No habia patron para dividir la columna de los nombres y los apellidos, pero si para dividir estas dos del rut, luego el sexo, y al final el numero de mesa. osea, podia dejar en una columna el nombre y apellido, segunda columna el rut, tercera columna el sexo, podrias generar una columna pues solo contenia dos tipos de datos (MUJ o VAR), luego viene la direccion dificir de identificar, y la circunscripcion, tambien dificil de identificar, luevo viene la mesa que es un numero y una letra (M o V) y antes de salto de linea en forma oculta, viene un numero de linea (que llegaba hasta 70 en cada pagina) esta ultima se podia eliminar facilmente un patron de reemplazo, luego podrian generar la ultima columna con el numero de la mesa, entonces te podria quedar asi:
|nombre y apellido|RUT|Sexo|direccion y circunscripcion|mesa|
si claro, en cuatro horas, hiciste todo eso.
si sergio, es asi de simple...
manipular millones de datos en un pc, con poca memoria (al menos que tengas 64 GB de ram) es tan facil, en 30 minutos lo tienes...
pero lo mas facil es identificar los patrones, es tan facil, como hacer un script.
son millones de datos, primero, no puedes generar UN archivo con todos los datos, ningun pc lo aguanta, por eso debes generar un archivo por cada pdf, existen pdf, que cargarlo, se demoran 10 minutos (un archivo, multiplicalos por los 350 pdf)
No manejas base de datos cargando todo a la ram, lo haces por parte, y lo vas tirando a un archivo de texto, si te soi franco, es imposible que lo cargen a un exel, en serio eso si no hay pc que lo aguante, pero si vas leyendo por parte y tirando a un archivo de texto si tienes posibilidad, quedando reducido en gran parte su tama~no, luego una forma facil de seguir es buscar elementos por columnas, nuevamente no necesitas cargarlo a la ram, solo leer un archivo (mientras no tengas un netbook estas bien)
ahora bien, me di cuenta que exagere, yo he echo esto en otros formatos (postscrip en particular), pero nunca en pdf, en el que el archivo biene encriptado, si copias todo con un ctrl + C a mano a un archivo de texto se puede, pero no leerlo del mismo archivo
Si quieres intentarlo con un ejemplo, (teniendo todo en en archivito de texto
awk ' { if($4=="Prada") print $0} ' Servel.txt (en un sistema UNIX como Mac o Linux o en
un emulador para Wind0s
imprimiras todos los datos con "Prada" en la cuarta columna (digamos, la de los apellidos) y listo, nada de exel ni cargar naaada a la ram
ahora bien, si quieres ponerte exigente tiralo a un archivo binario, donde ocupara varias veces menos memoria, y lo leera mucho mas rapido =)
Sorry por no verificar lo del formato pdf, admito que actue con sobervia =( y si
creo que esta gente que dice que lo tiro tooooodo a un exel... o tienen un muuuuuuuuy buen pc o naris de pinocho xD
Donde puedo encontrar la base de datos de servel? quien sera el amable? :P
gracias
La base de datos de los votantes (ahora, todos los chilenos +18) se puede comprar en el servel y lo único que te cobran son los CDs.
Los datos son públicos, así de sencillo, no me aleguen a mi, aquí más info al respecto, http://blog.felipebarriga.cl/privacidad/ley-de-transparencia-bases-de-datos-del-servel-y-junaeb/
@sergio: exacto...
no puedes manejar una base de datos de esas proporciones en la ram...
por eso dije que los de arribas eran mentiroso, cuando dijieron que en una tarde o en cuatro horas, la habian dado vuelta, eso era imposible, ademas uno de ellos aseguraba que tenia un tarro viejo.
bueno, veo que entiendes de la materia..
y tambien entiendo que por no ser chileno, tenias poca idea de lo que se hablaba, pero amigo te dijo, con patrones y todo, y generando un pequeño programita que me hacia la pega automaticamente, me demore un par de dias, passar el sistema a una base de datos.
aunque en realidad solo lo hice para una comuna, pero la mayor parte del trabajo (que era reconocer los patrones) ya esta hecho, es solo ingresar los archivos de las demas comunas, pero aun asi, me demoraria un par de dias mas, en completar los 350 archivos. y no una tarde o cuatro horas.
PD:
pero como dicen mas arriba, mejor la pides al SERVEL, te cobran el puro cd y la obtienen ya lista.
Jajaja @pobregusano gracias por la aclaraxion ;)
@Pinochet: ¿vai a prestar el poto que te tenemos que dar las gracias?
pfff 5 dolares por solo cuentas de correo electronico?
Responderyo descargue los 1.4 GBs de PDF´s del servel GRATIS
y tengo las direcciones reales y su nucleo familiar
Choca esos 5! xD
Si lo que le interesa a alguien es mandar spam o hacer phishing con mails falsos de bancos. Las cuentas de email son harto mas valiosas que las direcciones fisicas de correo.
No se preocupe amigo... dejele su nombre, y le chocan los 5 en su propia casa gracias al SERVEL
http://i3.kym-cdn.com/entries/icons/original/000/000/554/facepalm.jpg
¿Ven muchachos?, por eso dicen que los primos no se tienen que casar entre ellos...
¿Qué acaso si usas Linux no usas facebook? Genius !
turun!!!...tssss!!!!
._. quien fue el hijo de puta que convirtio fans de Mac en Linux/Ubuntu... hablan cada wea... que conste, yo uso linux, pero no conosco a este culiao.
Que se pudra Flanders
Nadie conoce a este puto, solo por que usa linux solo una semana viene a hablar webadas, todos los linuxeros nos estamos revolcando en el suelo ahora mismo...
@drkpkg OOOOOOHHH!! que bkn eres linuxero!! cuentame más! debes dejar impresionados a todos en tus reuniones sociales al decirlo!
Y ahora debes sentirte todo un rock star por burlarte de alguien que sabe un poco menos, te felicito te ganaste unos likes, 3r35 bu3n0 h4m1g0!
"El conocimiento, si no es compartido, no sirve de nada".
Ubunto ,Ubunto ,Ubunto ,Ubunto ,Ubunto ,Ubunto
Que les mande el archivo? jajajajajajjaa, que se los mande de vuelta? welcome to the internet, pal que pidio eso, como si los medios logicos fueran materiales
Responder"además de pedirle encarecidamente que no divulgue la charla ni comparta la información escuchada ni difunda el accionar solicitado por Facebook, así como también que les mande el archivo, lo borre de sus computadoras y no hable con nadie"
ResponderYaaaaaa, alguna otra cosita que se te haya pasado nombrar :P
no tienen nada de sorprendente la noticia, quienes tienen acceso a FacebookSQL podemos sacar bastantes datos privados de los usuarios, aunque esto no los expongan.
ResponderY el token lo adivinás, no?
"La fuerza siempre sera usada por aquelllos con inteligencia limitada"
A todas luces la ingenieria social lo hace mucho mas facil, permitiendo acceso a los datos de las personas por las aplicaciones que aceptan, jueguitos, Horoscopo, tarot, deportes, etc... basura y alguna no tan basura que la gente esta dispuesta a aceptar sin leer los terminos donde claramente se explica "Esta aplicacion tendra acceso a su informacion basica como contactos, correo, etc etc etc..."
En esta pagina tambien que es parecida se venden ese estilos de cosas
Responderhttp://www.comprita.com/
Gracias a facebook entre otras nos seguiran robando nuestra privacidad
La gente es la tonta por exponerse.
Creo que el 85% de la responsabilidad es por parte de los usuarios que aceptan todo tipo de aplicaciones sin siquiera revisar los permisos que solicitan o verificar el desarrollador. Las aplicaciones deben tener acceso a muchos datos para tener una buena interactividad, necesariamente. Eso es responsabilidad de los desarrolladores, pero más aún de los usuarios sobre qué instalan.
ResponderHey, pero donde está la conversación que tuvo con Facebook, pense que la tenian publicada, creo que mejor seria que publicque la base, yo se la compro por $6...
Responderyo tambien tengo los pdf del servel exportados... me costo varios dias... luego montarlos a excel para pasarlos a CSV... de ahi directo a un gestor de base de datos... seria ilegal si con algo web scraping me pongo a wevear con facebook? aprovechando los datos?
Responder¿Y dónde se puede descargar esa base de datos?. Sin link no vale.
ResponderActualicen la nota. Los matones de FB se contactaron con el bloguero y le exigieron borrar la BD. Acá la info:
Responderhttp://talkweb.eu/openweb/1842
donde puedo descargar la base de datos?
ResponderCompranos, es una empresa virtual que nacerá en 2013 con la majestuosa idea de Crear Bases de Datos, de Empresas, para así lograr que sus clientes encuentren nuevos clientes. Estamos con este proyecto realizando las Bases de Datos, recolectando información de millones de Paginas Web, lo cual es totalmente legal, tarda mucho organizar un archivo, pero gracias a la paciencia y entusiasmo que se tiene se espera que para el 2013, se ponga en marcha este proyecto. Esperamos tener éxito y ofrecerles muy buen precio para que todo el mundo tenga acceso a ellas. Saludos desde Venezuela.. No olviden Visitarnos.
ResponderCompranos.jimdo.com
Deja tu Comentario