La inteligencia artificial que aprendió por sí misma a moverse y a cumplir con tareas básicas

La inteligencia artificial de Google fue puesta a prueba para aprender por sí misma las capacidades que tiene para realizar tareas aprendiendo desde cero.

Deepmind es la compañía dedicada a inteligencia artificial de Google cuyos últimos desarrollos se han basado en lo que se conoce como machine learning, o aprendizaje automático. Este concepto se basa en que a partir de la observación de cosas o acciones previas, una inteligencia artificial consiga nuevos conocimientos y logre realizar ciertas tareas con una eficiencia superior al promedio.

En este principio se basó Google Deepmind a la hora de crear a SAC-X (Control Auxiliar Programado en inglés). Su objetivo es completar tareas que a simple vista parecen muy sencillas pero no sabe llevarlas a cabo. Básicamente no tiene conocimientos de nada, ni siquiera de cómo moverse. Es deber de la inteligencia artificial descubrir cómo hacerlo, practicar la motricidad y perfeccionarla hasta el nivel de poder mover objetos, apilarlos, o guardarlos en una caja.

 

Deepmind llama a este proceso "aprendizaje desde cero". Lo comparan con el proceso que experimenta un bebé en sus primeros años de vida: aprender a gatear y caminar antes de poder lograr mayores cosas en los próximos años o en su etapa adulta.

La primera parte del proceso recreó un entorno virtual donde la inteligencia artificial podía mover un brazo robótico a su disposición y tenía la tarea de recoger unos cubos y saber ponerlos uno encima de otro. El sistema tenía que descubrir por sí mismo qué posibilidades de movimiento tenía, cómo podía detectar a los objetos a su alrededor y en qué posición debía poner la garra del brazo robótico para poder agarrar un cubo.

 

Al principio el proceso era muy torpe, pero con cada tarea realizada la inteligencia artificial se veía recompensada por un premio virtual simbólico. En caso de haber sido exitoso, se le daba un valor de 1; de haber fallado, se le daba un 0. Eventualmente de tanto "ensayo-error", SAC-X terminó perfeccionando la técnica de mover objetos y manipularlos según se le ordenara.

 

Lo llamativo de esto es que el experimento no terminó en ese punto sino que lo transportaron al mundo real. Esta vez un brazo robótico físico con sensores de imagen y de tacto debía hacer lo mismo que realizó en la simulación virtual. El experimento fue repetido muchas veces con los objetos hasta que eventualmente fue capaz de agarrar  exitosamente los objetos situados a su alrededor.

 

Para Deepmind este un importante avance para el aprendizaje de tareas de control. Eventualmente nuevas tareas podrían ser asignadas para mejorar los resultados en el campo de sistemas de control y robótica.