fayerwayer

SindeClon: Otro instrumento para burlar la lucha antidescargas

Un proyecto que permite copiar y estructurar los datos que se presentan desde cualquier página Web. Conversamos con su desarrollador y aquí os traemos detalles de su propuesta.

Estamos a un par de semanas de que en España comience a aplicarse la Ley Sinde, mejor conocida como Ley Antidescargas, y siguen saliendo a la luz proyectos que demuestran la inutilidad que tendrá -afortunadamente- dicha herramienta de censura en la Red.

Y es que si hace  unos días os hablaba de “Cuélgame“, una plataforma de compartir enlaces al mejor estilo de Menéame; hoy toca que os cuente de otra herramienta que bien puede servirnos para burlar la lucha antidescargas: SindeClon, un proyecto que nace con una intención educativa, y que permite copiar y estructurar los datos que se presentan desde cualquier página Web, para después poder analizarlos y reutilizarlos como si hubieran sido ofrecidos en formatos manejables, como un PDF, por ejemplo.

Dado el contexto en que vivimos, tras casi un mes del cierre de Megaupload, y en la cuenta regresiva para que la Ley Sinde comience a cerrar Webs en España, SindeClon se perfila como una alternativa para burlar las restricciones que plantea la Ley Sinde: Podría realizarse, por ejemplo, una copia de los “índices de enlaces” que ya existen, de manera que cuando se cierren dichas Webs ya tengamos el material respaldado.

Claro está esto funcionaría en el caso de los archivos P2P, no en el caso de las descargas directas, pero igual nos ayudaría a burlas las restricciones y continuar compartiendo datos… SindeClon es una iniciativa del joven informático español Juan Gabriel Covas, (@juangacovas) quién tuvo la amabilidad de responder algunas de nuestras preguntas sobre este particular proyecto.

– Fayerwayer: SindeClon nace como un “proyecto educativo”… ¿Qué rol cumple en términos de educación?
– Juan Gabriel Covas: El proyecto SindeClon es educativo, pretende difundir la idea de que además de “copiar” una página web, en muchos casos se puede ‘extraer su ADN’ (los datos que presenta) para darle otros usos o presentarlos en otros formatos. Un ejemplo son algunas aplicaciones para móviles, que presentan la misma información que puede tener una web, pero de otra manera, o los típicos “comparadores de precios” de varias páginas distintas.

El web-scrapping consiste básicamente en extraer datos no estructurados de la Web y organizarlos en tu propia base de datos, normalmente escribiendo un programa informático que simula ser un humano navegando las páginas: Recogiendo y organizando la información de forma automatizada.

Hacer esto no siempre es algo trivial: Se utilizan diversas técnicas en función de lo que se pretende conseguir, la forma en que la página presenta la información, si se requiere o no una identificación de usuario para acceder al contenido, etc. El proyecto SindeClon busca compartir esta serie de técnicas para que otros puedan aprender.

– FW: Si su naturaleza es educativa, ¿por qué llamarla “SindeClon? ¿Es un acto de rebeldía o provocación?
-JGC: Es un nombre oportunista, es verdad, pero relacionado por el momento que vivimos en España. Por mi trabajo como programador informático, se me acumularon algunos proyectos especialmente dedicados a la extracción de datos de varias páginas web.

Tenía pensado hacer en algún momento una página para compartir este y otros intereses, pero 2012 comenzó con el visto bueno a la Ley Sinde, que debería entrar en vigor el próximo 1 de marzo, así que pensé que SindeClon sería un nombre bastante irónico para un proyecto como este en el que se busca reutilizar datos de cualquier página web.

– FW: -¿Y no crees que al bautizarla “SindeClon” podrías atraer las miradas de la “brigada antidescarga” cuando la Ley entre en vigor? ¿Temes alguna persecusión o represalia?
-JGC: La verdad es que no, en el proyecto no hay enlaces a contenidos protegidos por copyright, sino técnicas y ejemplos de cómo extraer información de otras páginas, que sí pueden contener dichos enlaces…

– FW: Es evidente que SindeClon se ve como un instrumento para burlar la Ley Antidescargas en España… ¿Es aplicable para burlar otras normas que prohíban el intercambio de información en la Red?
– JGC: Si alguien nos dijera que muy pronto van a prohibir algunos libros -incluso confiscándolos llegado el caso-, ¿quién no se rebelaría, intentando salvar alguno de sus ejemplares más queridos? Los más temerosos, quizá intentaran preservar alguna obra en varios rollos de papel higiénico, transcribiéndolos a mano con letra muy pequeña. Básicamente eso es una de las ideas que puede transmitir el proyecto SindeClon, pero en el ámbito de Internet y utilizando la informática para evitar hacerlo “a mano”.

Con Wikileaks se montó un sistema de réplicas para preservar el contenido ante el bloqueo de sus páginas. No sé si ocurrirá algo así en España con alguna web especialmente popular cuando entre en vigor la Ley Sinde, pero el proyecto SindeClon demuestra que sería posible repetirlo, y que es una ley muy mal hecha, como ya se ha dicho tantas veces.

– FW: Hemos visto cómo GoogleDocs sirve para burlar la Ley Sinde (con el experimento de David Bravo). Hace unas semanas llegó Cuélgame.net (el Menéame de los enlaces) y ahora SindeClon… ¿Crees que los que diseñaron la Ley antidescargas comprenden lo complicado que es “frenar” el intercambio de archivos en la Red?
– JGC: Yo entiendo que los promotores de la Ley Sinde son muy conscientes de que no se puede acabar con el intercambio de archivos en redes P2P, pero sí que buscan cerrar las webs más populares para hacer más incómodo el intercambio: son estas webs las que permiten usar el P2P con seguridad (descargar exclusivamente contenido seguro y de calidad, enlazado por webs de “confianza”).

El intercambio ya sucedía antes, físicamente, y saben que seguirá ocurriendo, lo que desean evitar a toda costa es que sea algo “popular”, o al menos ponerle las mayores dificultades posible.

Muchas webs de enlaces a descargas se nutren de otras webs, se copian “los datos” entre ellas. Hace tiempo incluso se filtraron las bases de datos de enlaces de seriesyonkis y peliculasyonkis. Pero eso resultó inútil. Tras el cierre de Megaupload, los enlaces a los archivos alojados allí dejaron de funcionar y se produjo una cascada de retirada de enlaces entre las distintas webs. No importaba que estuvieran clonados en multitud de sitios: Todos habían dejado de funcionar.

En cambio los enlaces de las redes P2P tiene sentido copiarlos, hacer un “libro” con ellos por ejemplo, ya que no indican una ubicación “física” del archivo sino cómo localizarlo en una red de intercambio determinada. No está garantizado que puedas descargar el archivo, es un archivo que podría estar disponible o no, en función de si hay personas que lo comparten, pero el enlace es válido para siempre.

– FW: Como profesional de la informática, y por lo visto defensor de la libertad en la Red… ¿Qué alternativa se te ocurre para la Ley Sinde: Una que permita a los creadores e Internet convivir en paz?
– JGC: Muchas organizaciones han aportado soluciones serias a un problema que para mí es entre consumidores y editores y distribuidores, solo que hay una parte que está demasiado acostumbrada a hacer las cosas a su modo sin “contestaciones” de ningún tipo, que en este caso son las de los propios consumidores.

Soy partidario de la “mano dura” con los que ganan dinero aprovechándose del trabajo ajeno, pero desde luego “la industria” tiene un problema de avaricia si varios cientos de particulares puede poner en jaque su modelo de negocio ofreciendo servicios alternativos. Significa que no han sido ni están siendo honestos con la cadena de valor.

Link: SindeClon

Tags

Lo Último


Te recomendamos