Internet

OpenAI habría alimentado a GPT-4 ilegalmente con un millón de horas de YouTube para crear a ChatGPT

En un giro inesperado se filtra el reporte de que la IA GPT-4 de OpenAI habría sido alimentada con un millón de horas de YouTube de Google para ChatGPT.

ChatGPT vs. Gemini.
Imagen: Forbes | ChatGPT vs. Gemini. OpenAI y GPT-4 |

Durante las últimas semanas ha crecido nuestra obsesión por comparar las dos principales plataformas de Inteligencia Artificial del planeta que existen hoy en día: ChatGPT de OpenAI y Gemini de Google. Pero ahora, en un giro absolutamente inesperado de los hechos resultaría que en realidad la IA de Sam Altman tendría en sus entrañas la esencia de su competidor, y todo gracias a YouTube.

PUBLICIDAD

Aquí en FayerWayer el equipo editorial ha publicado en más de alguna ocasión una comparativa en donde ponemos a competir a ambas Inteligencias para intentar determinar cuál es la mejor. Llegando siempre a la invariable conclusión de que en realidad todo depende de cuáles sean nuestros objetivos y cómo deseemos aplicar estas herramientas.

Gemini vs ChatGPT | Composición
Gemini vs ChatGPT | Composición

Pero ahora acabamos de descubrir que en realidad ambas plataformas no estarían en realidad tan alejadas entre sí. De hecho, resultaría que la IA de OpenAI en su núcleo habría contado con una intervención directa y determinante por parte de Alphabet, la empresa matriz detrás del motor de búsqueda, Gemini y YouTube.

Recomendados:

ChatGPT tiene alma de Google por YouTube

Resulta que un informe explosivo publicado por el diario del The New York Times revela que OpenAI, la empresa de Inteligencia Artificial, dirigida por Sam Altman y responsable de potenciar a Copilot de Microsoft, habría transcrito más de un millón de horas de videos de YouTube sin autorización, con el fin de entrenar su modelo de lenguaje GPT-4.

La información, obtenida a través de fuentes anónimas, asegura que OpenAI habría desarrollado un programa llamado Whisper desarrollado única y exclusivamente con la finalidad de extraer el audio de los videos de la plataforma de Google para convertirlos en texto, convirtiéndose así en la base para alimentar a GPT-4, el núcleo sobre el que corre ChatGPT.

YouTube - ChatGPT - Gemini
Imagen: WIRED | YouTube - ChatGPT - Gemini

Eso no sería un caso donde Google sea la víctima absoluta del caso, ya que la empresa propietaria de YouTube, también estaría involucrada en prácticas similares para entrenar sus propios modelos de IA. Pero en ambos casos las compañías estarían violando los derechos de autor de los creadores de contenido.

El informe del Times coincide con una investigación previa publicada por los chicos de The Information, donde de igual manera se denuncia la extracción de datos de YouTube y podcasts por parte de OpenAI para entrenar dos de sus sistemas de Inteligencia Artificial. En ambas situaciones los informantes aseguran que la institución de Sam Altman estaba consciente de lo que hacían y los riesgos éticos y legales que implicaba el uso de Whisper.

En sus propias políticas, términos y condiciones de uso YouTube explícitamente prohíbe la descarga de transcripciones o fragmentos de video sin su autorización, lo que convierte la acción de OpenAI en una clara violación de dichos términos de servicio.

Qué dice YouTube sobre la supuesta violación de OpenAI con ChatGPT

A principios de este mes de abril de 2024 la gente de Bloomberg logró abordar el tema de estas prácticas de sustracción y transcripción con el CEO de YouTube, Neil Mohan, quien terminó por reconocer la existencia de estas prácticas, pero no confirmó si OpenAI utilizó o no los datos de YouTube:

“He visto informes de que puede haber sido utilizado o no (la sustracción y transcripción por parte de OpenAI). Yo no tengo información concreta al respecto.”

Youtube

La parte alarmante es que el informe también menciona que algunos empleados de Google conocían las actividades de OpenAI, pero no habrían intervenido debido a que la empresa también recurre a prácticas similares para entrenar sus propios modelos de IA.

Alphabet en contraste, según marca el artículo del Times, solo extraería datos de videos con el consentimiento explícito del creador de los mismos, por lo que ChatGPT sí habría incurrido en una falta grave.

En todo caso queda claro que la industria de la Inteligencia Artificial tiene un severo problema de transparencia.

Tags


Lo Último