Microsoft crea un bot que pinta retratos a partir de texto

Microsoft crea un bot que pinta retratos a partir de texto

Imaginación digital. Los chicos de Microsoft han creado AttnGAN, una inteligencia artificial capaz de generar imágenes luego de analizar un simple texto.

La inteligencia artificial avanza a pasos agigantados. Hace algunas semanas vimos cómo estos sistemas ya pueden crear FanFiction de primer nivel, y ahora Microsoft rompe una nueva barrera, con un bot capaz de pintar retratos complejos a partir de descripciones textuales.

Investigadores del Deep Learning Technology Center en Microsoft han publicado los avances de su proyecto en Arxiv, bajo el título “AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks“, en donde muestran esta plataforma.

Tal como se muestra, el bot es capaz de crear imágenes a partir de descripciones de texto de un objeto; pero también agrega algunos detalles que no son marcados en el texto, como el cielo de fondo; esto indica que la inteligencia artificial de Microsoft tendría también una suerte de “imaginación digital” propia.

Xiaodong He, uno de los investigadores principales del proyecto, explica así el proceso básico del sistema AttnGAN, para el blog oficial de Microsoft:

Si vas a Bing y buscas un pájaro en el buscador, obtienes una foto de pájaro. Pero aquí, las imágenes son creadas por la computadora, píxel por píxel, desde cero. Estas aves pueden no existir en el mundo real. Son solo un aspecto de la imaginación de las aves de nuestra computadora.

Así funciona AttnGAN

La tecnología del bot de dibujo se basa en dos modelos de aprendizaje automático: uno para generar imágenes a partir de descripciones de texto; y otro que usa esas descripciones de texto para evaluar la autenticidad de las imágenes generadas.

El primer modelo genera las fotografías “pintadas” (falsas) y el segundo detecta detalles que pueden ser considerados auténticos; descartando los que no, para volver a ser generados por el primer modelo.

La combinación de ambos elementos es lo que logra el retrato final. Sin embargo, la tecnología es aún imperfecta, pero funciona en principio.

Las aplicaciones, más allá de ser una herramienta de apoyo para diseñadores y artistas gráficos aún no quedan muy definidas.

Pero aún así parece que Microsoft tiene una tecnología prometedora entre manos.