Internet

Nvidia Maxine optimiza videoconferencias con Inteligencia Artificial

La compañía desarrolla una función que permita ver a los ojos a una persona durante una videoconferencia.

videollamada
videollamada (Unsplash)

Desde la llegada de la pandemia por el Covid-19, las dinámicas laborales por videollamadas se aceleraron a tal punto que empresas como Zoom se posicionaron entre las líderes del mercado tecnológico.

PUBLICIDAD

Dos años después y con parte del problema sanitario en proceso de ser solventado, más compañías se enfocaron en desarrollar mejores experiencias al momento de realizar videollamadas.

Entre esas empresas se encuentra NVIDIA, conocido en el mundo de las unidades de procesamiento gráfico y tecnologías de circuitos integrados para estaciones de trabajo.

Recomendados

Nvidia desarrolla un producto para optimizar videollamadas llamado Maxine que es un SDK de plataforma totalmente acelerado para que los desarrolladores de servicios de videoconferencia creen e implementen funciones impulsadas por IA que utilizan modelos de última generación en su cloud.

[Nueva función de Google Meet evitará que los participantes activen accidentalmente el audio y video]

Los SDK de IA de Maxine (efectos de video, efectos de audio y realidad aumentada (AR) son optimizados e incluyen características modulares que se pueden encadenar en canalizaciones de extremo a extremo para ofrecer el mayor rendimiento posible en GPU, tanto en PC como en centros de datos.

¿Cuándo vamos a mirar a los ojos a las personas en una videollamada?

Esa es la pregunta que quiere responder de manera eficiente los desarrolladores de NVIDIA quienes trabajan en una función para corregir la posición de los ojos durante una videoconferencia.

Esta herramienta, que de momento se encuentra en modo Beta para los desarrolladores, funciona con un algoritmo de Inteligencia Artificial, que tiene como objetivo de que siempre estemos mirando al interlocutor a pesar de que los ojos se encuentren mirando a otro lado.

“El SDK de Realidad Aumentada ofrece seguimiento facial en 3D basado en IA y en tiempo real y estimación de la postura corporal basada en una alimentación de cámara web estándar. Los desarrolladores pueden crear efectos AR únicos, como superponer contenido 3D en una cara, conducir personajes 3D e interacciones virtuales en tiempo real”, indican en su sitio web.

Cancelación de audio acústico

NVIDIA anunció en GTC que Maxine además está agregando cancelación de eco acústico y upsampling basado en IA para una mejor calidad de sonido.

“La cancelación de eco acústico elimina el eco acústico de la transmisión de audio en tiempo real, preservando la calidad del habla incluso durante la doble conversación. Con la tecnología basada en IA, Maxine logra una cancelación de eco más efectiva que la lograda a través de algoritmos tradicionales de procesamiento de señal digital”, señala la compañía.

Tags

Lo Último