Temas Calientes

Investigadores desarrollan un algoritmo para determinar si un tuiteo es mentira

(cc) Juampe López

(cc) Juampe López

Cuando ocurre un desastre natural o una tragedia, nunca falta gente que se dedica a inventar información y subirla a Internet, quizás con el ánimo de ser chistosos, o simplemente para divertirse confundiendo a la gente. Así para el huracán Sandy aparecieron fotos de gente buceando en las estaciones de metro o tiburones en la ciudad, o para el terremoto de 2010 en Chile salieron personas diciendo que Ricardo Arjona había muerto o que el Huáscar había desaparecido de Talcahuano.

Los investigadores Carlos Castillo (Qatar Research Institute), Marcelo Mendoza (Universidad Técnica Federico Santa), y Bárbara Poblete (Departamento de Ciencias de la Computación de la Universidad de Chile) escribieron en 2010 en paper [PDF] analizando los tuiteos emitidos tras el terremoto de 8,8 grados de magnitud, llegando a varias conclusiones que ahora aplicaron en un algoritmo.

Este “detector automático de eventos” usa 16 características para determinar la credibilidad de tuits noticiosos, y será publicado en la revista Internet Research el próximo mes.

“Nuestros datos muestran que es posible separar eventos que corresponden a noticias confirmadas de aquellos que en realidad son rumores”, explicó a FayerWayer Marcelo Mendoza, doctor en Ciencias de la Computación de la Universidad de Chile y académico de la UTFSM. “Twitter registra volúmenes muy significativos de tweets que no tienen valor informativo. Sin embargo, nuestro algoritmo puede detectar tweets informativos y extraer información relevante desde ellos”.

Entre las conclusiones de 2010, los investigadores determinaron que los rumores falsos tenían una alta probabilidad de ser tuiteados junto a un signo de interrogación, o una indicación de duda o negación. También concluyeron que los tuits verdaderos tienden a ser más largos e incluir URLs, que las personas que tuitean cosas verdaderas suelen tener más seguidores, y que los mensajes que son ciertos suelen ser más negativos que positivos en el tono en que están escritos. Además, los tuiteos verdaderos no suelen incluir signos de interrogación, exclamación o pronombres en primera o tercera persona.

El nuevo algoritmo desarrollado por Castillo, Mendoza y Poblete funciona bastante bien, logrando clasificar como “verdaderos” a los tuiteos verdaderos un 86% de las veces.

“El algoritmo realiza análisis agregado, es decir, caracteriza “grupos” de tweets (no tweets aislados). La fortaleza radica principalmente en la caracterización de eventos a partir de grandes volúmenes”, dice Mendoza. “Más tweets permiten mejores estimaciones”.

Por supuesto, no es un sistema perfecto y quizás una persona entrenada en el uso de redes sociales podría obtener un mejor resultado intentando determinar la veracidad de un mensaje. De todos modos, un algoritmo funciona muchísimo más rápido que una persona, y podría servir como un “primer filtro” para marcar los tuiteos dudosos.

De acuerdo al trabajo que saldrá publicado, “antes de que una noticia se transforme en trending topic es posible estimar la credibilidad de ella. Nosotros aplicamos nuestro algoritmo a los tweets del terremoto del 27-F mostrando que era posible validar las alarmas del tsunami antes de que éstas llegaran a Juan Fernández. Con un tráfico adecuado, la validación de la credibilidad de un evento puede realizarse durante los primeros 15 a 20 minutos transcurridos desde el primer tweet relacionado con el evento”, afirma Mendoza.

Quizás podría ahorrarnos algo de confusión entre los usuarios de la red social, aunque siempre habrá gente ingeniosa que intentará engañar al resto.

Link: Social media hoaxes: Could machine learning debunk false Twitter rumors before they spread? (Slate)

27 Comentarios

Investigadores desarrollan un algoritmo para determinar si un tuiteo es mentira

Thumb up 19 Thumb down 2 avatar_Luis Luis dijo hace 5 meses

Mira que interesante ah.

Responder
Thumb up 12 Thumb down 7 avatar_David David dijo hace 5 meses

Es cierto, lo desarrollaron entre TODOS los chilenos, pero no funciona. Que amarillista el articulo.

Responder
Thumb up 1 Thumb down 3 avatar_Luis Luis dijo hace 5 meses

De acuerdo contigo, menos con lo de amarillista, primero busca que significa estimado. por lo demas super de acuerdo contigo.

Thumb up 3 Thumb down 1 avatar_Luis Luis dijo hace 5 meses

Prensa amarilla o prensa amarillista es aquel tipo de prensa sensacionalista que incluye titulares de catástrofes y gran número de fotografías con información detallada acerca de accidentes, crímenes, adulterios y enredos políticos.

Thumb up 1 Thumb down 1 avatar_TroLLL TroLLL dijo hace 5 meses

http://www.fayerwayer.com/2012/12/trabajadores-de-foxconn-desean-poder-hacer-mas-horas-extra/

Thumb up 11 Thumb down 3 avatar_ASD ASD dijo hace 5 meses

y luego uno pq te pone negativos, como dijeron por ahi tenia que ser el denis del 8, Negativazo desde tiempo inmemorables

Thumb up 12 Thumb down 2 avatar_jack! jack! dijo hace 5 meses

Me saco el sombrero por este avance tan revolucionario y el aporte que esto significa para el progreso de nuestra humanidad!!

Responder
Thumb up 25 Thumb down 7 avatar_Kansja Kansja dijo hace 5 meses

def(4chan_joke):
if 4chan = True:
tweet = False.

Responder
Thumb up 5 Thumb down 1 avatar_Jerk Jerk dijo hace 5 meses

ese pedazo de codigo parece Python o Ruby. para la proxima vez opina mejor, no son arcaicos. si quieres llamar arcaico a algo llamale a cobol, a, b, lisp, etc.

Thumb up 0 Thumb down 0 avatar_Kansja Kansja dijo hace 5 meses

Efectivamente es Python, que me he tomado como hobby hace 3 semanas aprenderlo.

Thumb up 3 Thumb down 1 avatar_pock pock dijo hace 5 meses

que bakan, me alegro harto por su logro

un 86% si bien es alto, igual da falso positivos de un 14% eso aplicado a un 1 millon de tuits no es poco, pero si quieres clasificar grandes volumenes de tuits y promocionarlos automaticamente, clasificarlos, o usar herramientas para periodistas no esta nada de mal.

ojala que sigan creciendo estos tipos, merecen aplausos y es el tipo de cosas que mas se necesitan hoy en dia, capos los tipos

Responder
Thumb up 2 Thumb down 1 avatar_jc rojas jc rojas dijo hace 5 meses

Yo creo que este artículo es un hoax

:B

Responder
Thumb up 2 Thumb down 2 avatar_NEOLEO NEOLEO dijo hace 5 meses

Eso le falto a Sagredo!

Responder
Thumb up 1 Thumb down 2 avatar_ND ND dijo hace 5 meses

Y si el Tweet es mentira, Pilar Sordo vendrá a "ayudarte" e "investigará" porque mientes jajajajaja gran fail esta noticia.

Responder
Thumb up 2 Thumb down 1 avatar_Jaquio Jaquio dijo hace 5 meses

que pasara cuando un mensaje falso y bien elaborado cumpla el patron de uno verdadero o viceversa, ellos mismos lo dicen:

"los rumores falsos tenían una alta probabilidad de ser tuiteados junto a un signo de interrogación, o una indicación de duda o negación...los tuits verdaderos tienden a ser más largos e incluir URLs...las personas que tuitean cosas verdaderas suelen tener más seguidores...los mensajes que son ciertos suelen ser más negativos que positivos en el tono en que están escritos...los tuiteos verdaderos no suelen incluir signos de interrogación, exclamación o pronombres en primera o tercera persona."

en fin, solo son probabilidades y NO se porque el titulo dice "...un algoritmo para DETERMINAR..." debería ser "...para ESTIMAR..."

Responder
Thumb up 1 Thumb down 0 avatar_Searcher Searcher dijo hace 5 meses

otro sitio de noticias copy paste ?

no gracias xD

Thumb up 0 Thumb down 0 avatar_guzzan0 guzzan0 dijo hace 5 meses

Se me ocurrio algo parecido, se podria buscar tweets referente a un evento y haciendo un parseo buscarlos en Internet y mediante un algoritmo analizar la noticia.

No estaria mal aplicarlo solo para probar, si el algoritmo que usan ellos no busca en Internet se le tendrian que dar una seria de patrones muy grandes, y es un problema y tiempo perdido.


Saludos.

Responder
Thumb up 0 Thumb down 0 avatar_braulio braulio dijo hace 5 meses

Fui a una charla que dio Bárbara Poblete (Departamento de Ciencias de la Computación de la Universidad de Chile) en la FCFM de la UCHILE hace varios meses donde hablo un poco de esta investigacion y menciono que otro factor importante era la velocidad con que se transmitia la noticia :)

Responder
Thumb up 0 Thumb down 0 avatar_gonzalo gonzalo dijo hace 5 meses

Se podría decir que detecta ironías tb?

Responder
Thumb up 0 Thumb down 0 avatar_edwin edwin dijo hace 5 meses

y si scribn asi abrviado xq no ls alknzan los 140 caractrs? Cómo lo sabrán?

Responder
Thumb up 0 Thumb down 0 avatar_Jose Jose dijo hace 4 meses

Si bien se basa en algunas características propias de un hoax, es una excelente herramienta. además un twitter puede ser desmentido si uno puede leer atentamente el contexto del contenido del tweet. por lo general van siempre acompañados por un (?) o hay inconsistencias en cuanto a lo que se dice.

a modo de ejemplo, se dijo por twitter que whatsapp iba a ser de prepago, pero si reenviabas "este mensaje" a 10 personas y pruebas que eres un usuario frecuente, se mantendrá gratuito. en la práctica la misma gente de whatsapp desmintió esta información y se la atribuyó a un twitero llamado hoaxslayer.

Responder

Deja tu Comentario

La opción de comentar está abierta a todos los usuarios, pero te pedimos por favor mantenerte dentro del tema del artículo y no publicar comentarios ofensivos o publicidad basura. Nos reservamos el derecho de eliminar cualquier comentario que no cumpla estas reglas.

Para que aparezca tu foto en vez del icono genérico en tu comentario, el email con el que comentas debe estar inscrito en Gravatar.

*