Con un algoritmo se pueden identificar los tweets que fueron escritos por borrachos

Con un algoritmo se pueden identificar los tweets que fueron escritos por borrachos

Filtrando palabras como "cerveza" un grupo de investigadores logró reconocerlos.

Una de las peores cosas que podemos hacer cuando andamos con unas copas de más es comenzar a enviar mensajes, sobretodo en internet y en una red social tan masiva como Twitter.

El problema es que mucha gente lo hace y ahora, además de ser un fenómeno gracioso, también es objeto de estudio para un grupo investigadores de la Universidad de Rochester de Nueva York. Éstos desarrollaron un algoritmo que es capaz de identificar los tweets que han sido escritos bajo la influencia del alcohol. Pero eso no es todo, también puede reconocer si la persona estaba bebiendo al momento de escribir el texto.

¿Cómo lo lograron? Los investigadores reunieron alrededor de 11.000 tweets geolocalizados posteados en Nueva York, entre julio del 2013 y julio del 2014. Luego, filtraron todos los posts según las palabras que escribía la gente en ellos, como “borracho” y “cerveza”, o sea términos relacionados al alcohol, separando a los ebrios de los no ebrios.

Ingresaron estos datos en el Mechanical Turk de Amazon y cada post fue revisado por tres personas del servicio, los cuales categorizaron los tweets respondiendo esta interrogante: “¿En el tweet existe alguna referencia a una bebida alcohólica?”. Si respondieron sí, debían continuar respondiendo estas preguntas:

  • “¿El tweet es sobre la misma persona tomando alguna bebida alcohólica?”
  • ¿El tweet fue enviado en el lugar y en el momento en que el usuario estaba bebiendo alcohol?”

Nabil Hossain, el líder del grupo investigador, creó tres algoritmos, más específicamente máquinas de soporte vectorial (Support Vector Machines – SVMs) para que respondieran una pregunta cada SVM. Éstos fueron desarrollados en base al 80% de las respuestas que entregó Mechanical Turk y fueron probados en el 20% restante. El porcentaje de éxito entre las respuestas de los algoritmos y del servicio de Amazon fue de un rango de 92% a un 82% desde la primera hasta la última pregunta.

En cuanto a si las personas que postearon bebieron al momento de escribir, el proceso para reconocerlo fue el mismo, pero esta vez filtraron los posts con palabras como “televisor”, “dormir” y “casa”, términos que estén relacionados al hogar. De esta manera podían identificar si estas personas se encontraban en su casa al momento de postear. Los resultados del experimento lanzaron un 80% de exactitud en este caso.

Con todo este proceso, los investigadores descubrieron que en la ciudad de Nueva York la gente prefiere beber alcohol en su casa o en algún lugar cercano a ésta, entre otras curiosidades. Si bien una red social como Twitter no parece ser tan representativa, este estudio puede servir como un punto de partida para investigaciones más profundas y extensas relacionadas al alcohol.

Opinar es gratis, como siempre. No olviden seguirnos y comentar en Facebook.