DEviaNT: Sistema que identifica frases con potencial para una broma de doble sentido

DEviaNT: Sistema que identifica frases con potencial para una broma de doble sentido

por

Chloé Kiddon y Brun Yuriy, dos científicos de computación en la Universidad de Washington, han desarrollado un sistema para el reconocimiento de un tipo particular de doble sentido, la broma gringa that’s what she said (es lo que dijo ella) popularizada en la serie The Office, en donde frases aparentemente inocentes pueden transformarse en un comentario obsceno al agregar insinuaciones sexuales a una conversación.

Básicamente el sistema llamado Double Entendre via Noun Transfer (DEviaNT), reconoce cuando es divertido seguir una frase con “that’s what she said” (TWSS) como cuando alguien dice “¿No crees que estos bollos son demasiado para esta carne?” o “Wow, esa es una espada muy grande”.

La automatización de este proceso implica la identificación de frases que contienen posibles eufemismos y siguen una estructura particular – un difícil problema para la comprensión del lenguaje natural.

Los investigadores empezaron analizando dos conjuntos diferentes de texto, una con 1,5 millones de frases eróticas, y otro con 57.000 de la literatura estándar. Para esta prueba entrenaron a DEviaNT con la recopilación de chistes de twssstories.com y textos no-TWSS de sitios como wikiquote.org.

El sistema logró un 70% de precisión, pero los investigadores dicen que esto es bajo porque gran parte de los datos de entrenamiento no eran de bromas TWSS, pero con más datos se podría alcanzar 99,5% de precisión. Los resultados serán presentados en la Reunión Anual de la Asociación de Lingüística Computacional en junio y esperan que más adelante el trabajo con DEviaNT pueda identificar otras expresiones de doble sentido.

Obviamente este sistema no sirve de nada si no pasa la prueba del “alburmexicano y como ejemplo todos (o casi todos) los tweets etiquetados con #alburfree,  bueno es lo que dijo ella.

Link: That’s what she said: Software that tells dirty jokes (Newscientist)