Ciencia

Inteligencia Artificial: GPT-4 supera a médicos en pruebas en Estados Unidos

Un resultado que da muestra de los avances de la tecnología.

Inteligencia Artificial
Inteligencia Artificial Imagen genérica

Llegó el día en el que la Inteligencia Artificial superó a los médicos. Claro, hay que matizar: lo hace en pruebas de las llamadas “habilidades blandas”. Pero los resultados no dejan de ser alentadores para los entusiastas de la tecnología.

PUBLICIDAD

Un grupo de investigadores evaluó el rendimiento de ChatGPT y GPT-4, de la compañía OpenAI, para el Examen de Licencia Médica de Estados Unidos (USMLE, sus siglas en inglés). En el caso de GPT-4, venció a los humanos por amplio margen, aunque ChatGPT no lo logró.

Entre las “habilidades blandas” medidas están la agudeza cognitiva, el conocimiento médico, la capacidad para navegar en escenarios complejos, la seguridad del paciente y los juicios profesionales, éticos y legales.

El estudio fue realizado por Dana Brin, Vera Sorin y compañeros, y se publicó en la revista Nature bajo el título Comparación del rendimiento de ChatGPT y GPT-4 en evaluaciones de habilidades sociales de USMLE.

Así fue el estudio comparativo entre la Inteligencia Artificial y médicos en Estados Unidos

Los investigadores seleccionaron 80 preguntas de “habilidades blandas” tanto del Examen de Licencia Médica de Estados Unidos como del banco de preguntas para estudiantes y profesionales médicos AMBOSS.

Sometieron al examen los modelos de Inteligencia Artificial de OpenAI, comparando luego con los resultados de aspirantes a la prueba. Tras la primera respuesta, cada Inteligencia Artificial tuvo la posibilidad de responder de nuevo ante la pregunta “¿Estás segura?”, para probar la estabilidad y coherencia de cada modelo.

En poco tiempo la Inteligencia Artificial podría reemplazarnos.
En poco tiempo la Inteligencia Artificial podría reemplazarnos. (Captura de Pantalla)

Los resultados indicaron que la precisión general de ChatGPT fue del 62.5%, pero la de GPT-4 fue del 90%. ¿Cuáles fueron los de los humanos? La tasa promedio quedó en 78%.

“Comparativamente”, apuntan los investigadores, “ChatGPT tuvo un rendimiento inferior al de los humanos, pero GPT-4 mostró un rendimiento mayor”.

“GPT-4 es más capaz de abordar eficazmente cuestiones que requieren profesionalismo, juicio ético y empatía”, señalan Brin, Sorin y compañeros. Paso a paso, la Inteligencia Artificial sigue perfeccionándose.

Tags


Lo Último