Temas Calientes

Las formas de interacción hombre-máquina que brillarán este 2012

m1111

Si hay algo que le falta a la historia de la computación moderna son innovaciones en términos de cómo controlamos los equipos. Porque desde la llegada de las interfaces gráficas de usuario (GUI) con mouse y escritorio allá por la década de los setenta, poco y nada hemos visto en gran cantidad de años.

Y es que tenemos que dar un buen salto temporal hasta llegar a las pantallas táctiles, las que se masificaron recién hace algunos años atrás gracias a la llegada de los teléfonos móviles inteligentes (smartphones) y más tarde las tabletas, pese a que la tecnología para crear estos paneles existía hace tiempo pero no había sido bien implementada.

¿Qué viene ahora? Nuevamente los aparatos móviles marcan la pauta y nos indican hacia dónde va el autobús de la interacción hombre-máquina, con varias tendencias tecnológicas que “casualmente” tendrán popularidad este año 2012, tomadas de la mano con varios productos estrella como el Samsung Galaxy S III, Kinect para Windows y el siempre presente iPhone 4S, junto a otro par de innovaciones que nos dan esperanzas de un futuro mejor, en donde podamos comunicarnos libremente con los aparatos computacionales para que nos escuchen, entiendan y resuelvan nuestros problemas.

Sensores en los móviles

Las herramientas más básicas que ayudan a las máquinas a entender un poco mejor al hombre son los sensores, aquellos que le indican al aparato el contexto en que se encuentra. Esta labor la cumplen los sensores de proximidad -que miden la distancia del dispositivo respecto al ser humano-, los de luz ambiental, barómetros -que detectan la presión atmosférica-, acelerómetros -que revelan la posición horizontal o vertical del equipo-, giroscopios -los que indican orientación- y brújulas. A esto hay que sumar el popular GPS, chip que entrega ubicación geográfica gracias al posicionamiento satelital.

Todo esto ya se encuentra disponible en gran parte de los teléfonos móviles y tabletas que se venden en el mercado general, siendo aprovechado para indicarle al aparato cómo debe comportarse según la postura de la persona que lo toma o bien servir como guía mientras la persona camina a través de un mapa en pantalla, entre varias otras utilidades que muchos ya conocen y disfrutan a diario.

Reconocimiento de voz

Avanzando en el tiempo es que aparece esta forma de hacer que nuestra máquina nos entienda, siendo una de las más naturales a las que podemos acceder en la actualidad. Porque hablar con las personas es algo que hacemos todo el día y cómo no traspasarlo al ámbito tecnológico, con proyectos de reconocimiento vocal de varios años de antigüedad que rondan desde los PCs de escritorio hasta lo visto en smartphones hoy en día.

Acá destacan productos que explotarán en popularidad este 2012, como Siri de Apple, presentado con el iPhone 4S a finales del año pasado, o el recientemente estrenado S Voice de Samsung, el que estará presente en el móvil Galaxy S III. A diferencia de lo disponible tiempo atrás, estos títulos presentan funciones más acabadas gracias a un entendimiento más complejo de las frases y el soporte para mayor cantidad de idiomas.

Por ejemplo, años atrás resultaba decir “Llamar a Juan” para que el teléfono entendiese la orden, sin embargo, hoy en día es posible construir mensajes más complejos como: “Siri, por favor dime cuál es la capital de Rusia y cómo estará el tiempo allá mañana”. La tecnología detrás del reconocimiento ha mejorado bastante y ahora se distinguen hasta los acentos de cada persona, haciendo más aplicable el sistema a tecnologías de uso masivo.

Pero si hablamos de reconocimiento de voz, tenemos que mencionar al mejor de todos en dicha labor: Watson de IBM. Se trata de una súper-computadora que entiende el lenguaje hablado de gran complejidad y es también es capaz de resolver toda clase de consultas gracias a su vasta base de datos interna, respondiendo incluso de mejor forma que un ser humano, algo que pudimos comprobar cuando Watson venció a los dos mejores jugadores históricos del programa de concursos Jeopardy en Estados Unidos.

¿Qué viene para el futuro? Integrar esta idea a mayor cantidad de aparatos, como se rumorea lo podría hacer Apple con una futura televisión con Siri, algo parecido a lo que están tramando el resto de los fabricantes de TV para algunos meses más.

Galaxy S III y el seguimiento ocular

Con el muy reciente lanzamiento del smartphone Samsung Galaxy S III entraron varias tecnologías muy interesantes para hacer “más inteligente” al equipo, partiendo por la capacidad de utilizar la cámara frontal para algo más que videollamadas: seguimiento ocular. Esto permite al aparato saber cuándo tenemos abiertos o cerrados los ojos, apagando o prendiendo la pantalla en forma automática según el uso que se le esté dando.

Dicha tecnología se llama “eye-tracking”, la que abre las puertas a un sin número de posibilidades realizables a través de la cámara frontal, gracias a software que reconozca más tipos de gestos faciales además de los generados por la vista.

Pero el Galaxy S III además reutilizó de otra manera los sensores anteriormente descritos para integrar nuevas formas de interactuar con el móvil, como lo visto en Smart Alert, función que repite las notificaciones de mensajes o llamadas perdidas cuando la persona toma el dispositivo con la mano desde la mesa, acción que se detecta en forma automática. También se recicló el sensor de proximidad para otra original labor: si estás enviando un mensaje de texto y te llevas el teléfono al oído, se marca automáticamente el número del destinatario y se realiza el llamado.

Microsoft Kinect para PC

Seguimos avanzando en la línea temporal y nos encontramos con un proyecto que hace tiempo está presente en la consola de videojuegos XBOX 360, pero que este año llegará a las computadoras comunes y corrientes gracias al producto Kinect for Windows, integrando el soporte para aplicaciones de este aparato en el sistema operativo de PCs más popular del mundo.

Para los que no recuerdan o no lo saben, este dispositivo consta de varias cámaras y sensores que identifican la posición corporal de la persona enfocada, traduciendo dicha información a algo digerible para la computadora. Hasta el momento es utilizado como controlador para los videojuegos, sin embargo, la introducción de Kinect for Windows trae mejoras para el reconocimiento de gestos faciales, prometiéndose su inclusión a PCs y notebooks tan pronto como este año.

Así, las posibilidades que se abren son casi infinitas: mover el mouse con la vista, manejar el reproductor musical con movimientos de manos en el aire, y en realidad, lo que se les ocurra.

Proyectos para el futuro

Hace pocos días atrás Disney mostró que están desarrollando una tecnología para convertir en tácil casi cualquier superficie, incluyendo incluso el agua, lo que serviría para hacer más inteligentes cosas como una mesa o la perilla de una puerta, gracias al entendimiento de gestos y posturas humanas que se harán a través de una computadora.

También se está planeando la evolución de las pantallas táctiles a través de sistemas de relieve que entreguen información a la persona respecto a lo que está tocando, lo que añade funcionalidad a tecnologías ya existentes.

Conclusión

Esta amplia gama de herramientas son las que nos permitirán movernos desde el mouse y teclado tradicionales hacia el manejo de computadoras más inteligentes, tecnologías impulsadas durante los últimos años principalmente gracias a los dispositivos móviles, las que llegarán en mayor o menor medida a los PCs tradicionales, siendo adecuado considerar que un smartphone o tablet sigue siendo una computadora.

¿Llegaremos cerca de algo parecido en la película Minority Report? Kinect abre las puertas para aquello, y en general, todo lo recién descrito, si es implementado en forma correcta, da para eso y mucho más.

14 Comentarios

Las formas de interacción hombre-máquina que brillarán este 2012

Thumb up 12 Thumb down 2 avatar_NARC NARC dijo hace 1 año

"Siri, cuál es la capital de LONDRES"

Responder
Thumb up 1 Thumb down 2 avatar_Juan Pablo Oyanedel Juan Pablo Oyanedel dijo hace 1 año

JAJAJAJAJJAJA EXCELENTE. Gracias por la corrección ;)

Thumb up 3 Thumb down 1 avatar_porlachucha porlachucha dijo hace 1 año

creo que te equivocas un poco en el asunto del reconocimiento de voz.. aunque hay que separar las cosas.. un tema es el reconocer voces. y otra cosa es enterder que significan esas frases reconocidas.. el proyeco de IBM, a mi juicio logra muy bien esos 2 aspectos, por un lado.. la parte cuasi mecanica de poder transformar lo que hablamos en informacion de entrada.. y por otro lado la dificil parte de entender que significa lo hablado.. yo creo que en poco tiempo mas, ese campo tendra un gran avance..
claro.. nada reemplazara al mouse en el corto plazo.. las tecnologias son caras en sus inicios.. el mouse, tendra aun una larga vida.. lo mismo el teclado.. impensable en estos dias un dispositivo sin teclado.. pero.. mientras mas se abaraten los costos de las nuevas tecnologias, mas se acerca dicional y querido mouse..

Thumb up 9 Thumb down 2 avatar_Pastoreo Pastoreo dijo hace 1 año

Mouse y teclado, el control insuperable en los shooter, barato y preciso.

Responder
Thumb up 0 Thumb down 1 avatar_Vicente Vicente dijo hace 1 año

Sobre Human–computer interaction tienen que habla con el "divinisimo" del centro de santaigo min 1m seg 16. http://tinyurl.com/7tc8mg8

Responder
Thumb up 4 Thumb down 2 avatar_Iván Iván dijo hace 1 año

En primer lugar comentar que escribo esto desde mi móvil, con su pantalla capacitiva y el teclado Swype, que me permite deslizar el dedo por las palabras en lugar de pulsar cada letra.
Gracias a estos avances de hardware (y de software, no nos olvidemos) cada vez echo de menos el teclado y el ratón.

En mi opinión no ea una cuestión tanto de tecnología como del uso de la tecnología. Yo mismo probé en mi casa a hacer experimentos para manejar mi ordenador en plan minority report. Es suficiente con unos leds infrarrojos, una webcam y unos trozos de reflectante. El caso es que por muy bonito que quede en la película, trabajar durante un tiempo con los brazos en alto se termina convirtiendo en una tortura, y al final, la comodidad es un factor demasiado importante.

Lo que a mi me gustaría ver del futuro de la comunicación con las máquinas no es la tecnología en sí, si no cómo se usa la tecnología, y en qué nos ayuda en nuestro día a día, qué al final es para lo que sirven estos estos aparatos tecnológicos, para ayudarnos.

Responder
Thumb up 2 Thumb down 3 avatar_pock pock dijo hace 1 año

sabes, creo que es interesante lo que resaltas de minory report y cansarse de tener los brasos en el aire

quizas falta un ingeniero que haga algo similar al esfuerzo en QWERTY donde se busco la frecuencia de las letras en un lenguaje, y se distribuyeron para que el usuario lo haga rapido y sin cansarse

podria hacerse un esfuerzo similar apuntando a kinect, donde la interaccion nos obligue a estar parados, y que cada movimiento equivalga a un suave movimiento que nos permita estar activos fisicamente al mismo tiempo que podamos entretenernos, jugar, trabajar, ver peliculas, etc, que el ejercicio sea sostenible en el tiempo, no genero dolor y asi salir del sedentarismo, creo que perfectamente se podria hacer una investigacion en el area

Thumb up 9 Thumb down 2 avatar_juanantonio juanantonio dijo hace 1 año

Si el futuro es Siri, yo no quiero el futuro

Responder
Thumb up 3 Thumb down 0 avatar_Carlos Carlos dijo hace 1 año

Yo tampoco, tengo miedo de que Siri se vuelva algo como Skynet de Terminator

Thumb up 0 Thumb down 1 avatar_retval retval dijo hace 1 año

Me llama la atención que el reportaje no mencione el reconocimiento de escritura, ya que tecnológicamente es una de las interfaces más antiguas. A pesar de que la mayoría de las tareas laborales y de estudio que cotidianamente realizamos lo hacemos escribiendo, lamentablemente hasta hoy no hay ningun sistema adecuado para el reconocimiento de la escritura. No hay tablets en la que pueda trabajarse escribiendo de manera natural, a pesar de las promesas de Lenovo en su thinkpad tablet o en notes de microsoft. Lo que existe hoy es muy primitivo y nadie escribiría un trabajo para la U o una nota para el trabajo de 2 páginas. Y sin embargo seguiremos escribiendo durante muchos siglos.

Responder

Deja tu Comentario

La opción de comentar está abierta a todos los usuarios, pero te pedimos por favor mantenerte dentro del tema del artículo y no publicar comentarios ofensivos o publicidad basura. Nos reservamos el derecho de eliminar cualquier comentario que no cumpla estas reglas.

Para que aparezca tu foto en vez del icono genérico en tu comentario, el email con el que comentas debe estar inscrito en Gravatar.

*