MIT desarrolla técnica para descifrar audio a partir de video

MIT desarrolla técnica para descifrar audio a partir de video

Recrean conversación en otra habitación a partir de vibraciones en la superficie de una bolsa de papas fritas.

Tal como suena. Un grupo de stalkers profesionales investigadores conformado por miembros de Adobe, Microsoft y MIT desarrollaron un método con el cual se puede levantar audio a partir de vibraciones microscópicas registradas en la superficie de cualquier objeto semi-flexible en video.

Los investigadores publicaron sus resultados en un elegantísimo video donde demuestran como a partir de una grabación de una bolsa de papas fritas en el piso de una habitación -al otro lado de una ventana hecha de vidrio a prueba de sonido- se puede reconstruir la música que está sonando. Como cereza en el pastel, la canción de prueba que usaron fue María Tenía un Corderito, el poema de guardería que le cantó Thomas Alva Edison al gramófono en la primera grabación de audio en la historia.

Si bien hay que tener en cuenta que la técnica de reconstrucción de audio a distancia no es fenomenalmente nueva. Desde la Guerra Fría existen sistemas para levantar audio a base de vibraciones microscópicas que se registran en las ventanas de cualquier habitación donde se este generando ruido y con ellos aparecen estos micrófonos externos LASER que se usan para levantar audio en base a estos micro-movimientos, así como sus respectivos sistemas de anti-espionaje.

Por ejemplo, la Casa Blanca hace -un muy conocido- uso de ventanas a prueba de vibración para evitar el posible levantamiento de audio a distancia. Así mismo la técnica existe en cultura popular hace rato. En Eagle Eye recrean una escena donde a base de vibraciones en una grabación se descifra un audio y, bueno, en Fringe son expertos en audio con micrófonos láser.

CSI: ¡Pum! Edition ya esta levantando audio a base de un café que registró el asesino en sus selfies

Entonces.. ¿Qué hay aquí?

Tenemos en nuestras manos un método más para levantar audio a distancia, que en potencia es más preciso que su hermanito mayor a base de laser de los sesentas y además este tiene la capacidad de ser asincrónico. Se puede levantar audio a base de algún video viejo, lo que nos ofrece la potencial capacidad de recuperar sonido a base de grabaciones ya hechas, cualesquiera que fuera su propósito original.

Para los paranoicos, les dejo el siguiente pensar: quién sabe cuantos años llevan las agencias de seguridad nacional de tener estas cámaras en funcionamiento. Y aún mejor, quién sabe cuanto tiempo antes que se puedan montar con facilidad junto con cualquier cámara de video en un drón.

Micrófonos laser, para el stalker dedicado

Desafortunadamente Afortunadamente la técnica requiere de video capturado a más de 6,000 marcos por segundo (FPS) para hacer una medición fidedigna, pero en su demostración hacen un ajuste para conseguir una recuperación decente usando cámaras “mundanas” de 60FPS siempre y cuando la cámara registre usando “captura gelatina” con un rolling shutter. Quiere decir, no vamos a poder reconstruir audio a base del cine mudo o desde algún video histórico ya que este no se capturó con un CMOS digital. Tristemente.

Aún así vale la pena tener en consideración el segmento entero de investigación de análisis de video de cualidades post-humanas y los desarrollos que llegarán a raíz de este. El mismo equipo de investigación detrás esta técnica de levantamiento de audio también desarrolló otra técnica llamada “Magnificación Euleriana de video” para descifrar estados corpóreos como flujos de sangre a base de un simple video. Les dejo el siguiente para que sueñen a gusto con la futurología detrás y lo que podría llegar algún día para nuestros celulares.